A história de como um estudante de artes liberais que era bom em francês se tornou um especialista em tecnologia de reconhecimento de voz: Donga Science

“O reconhecimento de voz é a intersecção entre linguística, ciência e tecnologia”, disse Cho Hyung-sil, CEO da empresa de reconhecimento de voz SiLnD.

O CEO da SiLnD, Cho Hyeong-sil, se reuniu em um local em Gangnam-gu, Seul, no dia 9. Jornalista Lee Chae-rin

“Defina a temperatura do ar condicionado para 23 graus.” “Sim, eu entendo. Há mais alguma coisa em que eu possa ajudá-lo?” “Onde está o posto de gasolina mais próximo?”

Recentemente, com o avanço da tecnologia de reconhecimento de voz, tornou-se moda realizar essas conversas com assistentes de voz em carros. A SiLnD, uma empresa sediada na Holanda, é uma empresa de tecnologia de reconhecimento de voz que fornece consultoria técnica para empresas que desenvolvem tecnologia de reconhecimento de voz. No dia 9 deste mês, conheci Cho Hyeong-sil, CEO da SiLnD, que visitou a Coreia para participar da “2ª Conferência Mundial sobre Ciência e Tecnologia Coreana”.

A atriz Cho é presidente da Associação de Mulheres Coreanas em Ciência e Tecnologia na Europa. Embora ele seja claramente um estudioso, seu bacharelado e mestrado são em literatura francesa e seu doutorado é em fonética. “Estudar com base no meu amor pela língua francesa conduziu-me no caminho para me tornar um cientista”, disse o Representante Chu, explicando o efeito sinérgico entre a linguística, a ciência e a tecnologia na era da Quarta Revolução Industrial.

Desde seus tempos de estudante, o CEO Zhou demonstrou grande interesse em “sons de fala”. Achei interessante que os sons da fala diferiam de acordo com a região, então imitar o dialeto era um hobby. Foi interessante que a entonação e o tom eram diferentes para cada idioma. Em particular, apaixonei-me pelo som agradável da língua francesa, por isso parti para França, fiz o meu doutoramento e trabalhei durante um ano na L&H, uma empresa multinacional belga que desenvolve tecnologia de síntese de voz.

READ  MS anuncia a nova atualização cumulativa para Checkpoint... Eficiência do Windows Update ↑

Em 2009, casou-se com um holandês e estabeleceu-se na Holanda, onde começou a trabalhar seriamente na área de reconhecimento de voz. A tarefa era desenvolver tecnologia de reconhecimento de voz para coreano e francês na equipa de desenvolvimento linguístico da Microsoft em Portugal. Trabalhei entre Portugal e a Holanda.

Com base em seu conhecimento de linguística, ele foi responsável por criar regras detalhadas para computadores reconhecerem fala e detectarem erros na tecnologia de reconhecimento de fala. A pronúncia incorreta foi alterada. Para entender os sistemas de computador, estudei codificação e processamento de sinais por conta própria. “O tema da minha vida permaneceu o mesmo, ‘The Sound of Words’, mas meu estilo mudou”, disse o CEO Chu.

O CEO Chu, que encontrou grande satisfação em seu trabalho, fundou a SiLnD em 2016. Além da consultoria técnica, também foi responsável pela comunicação entre empresas que desenvolvem tecnologia de reconhecimento de voz e linguistas. Por exemplo, quando uma empresa pergunta: “Por favor, diga-me as regras de pronúncia para Saishiot”, o CEO Zhu recebe as regras relevantes de um linguista, depois as transforma em regras que podem ser aplicadas aos produtos e as apresenta à empresa. Também cooperamos com empresas como Volkswagen e Audi.

Segundo o CEO Chu, há inúmeras coisas que podem ser ensinadas aos computadores na área de tecnologia de reconhecimento de voz. No caso do idioma coreano, deve ser “.” em “www.dongascience.com” como “ponto final”, mas deve-se ressaltar que não deve ser lido quando estiver no final de uma frase. Quando o usuário diz “Papai vai para a bolsa”, deve ser criada uma regra para que o computador entenda o contexto e determine se “Papai vai para o quarto” ou “Papai vai para a bolsa”.

READ  “O que é isto?”… A comunidade científica ficou chocada com a imagem da inteligência artificial apresentada no artigo.

“As habilidades de leitura e fala que adquirimos naturalmente são completamente desconhecidas dos computadores”, disse o CEO Zhu, acrescentando: “Com a aplicação da tecnologia de inteligência artificial (IA), os computadores foram capazes de aprender grandes quantidades de dados por conta própria, mas em no campo da “Linguagem, os humanos ainda precisam seguir regras detalhadas”.

Ao desenvolver tecnologia de reconhecimento de voz, não imitamos todos os sons da fala humana. “Se a voz estiver muito próxima do coloquial, a confiabilidade diminui. A voz ‘Siri’ do iPhone é muitas vezes ridicularizada porque não é natural, mas nós a mantemos porque é uma voz que dá confiança”, disse o CEO Chu.

Só porque uma palavra é comum não significa que seja totalmente reconhecida pelos computadores. Também é função do CEO Chu fazer a curadoria da lista de novas palavras que sejam relevantes para os consumidores do produto, incluindo quais palavras devem ser adicionadas ou removidas.

O CEO Chu enfatizou que o objetivo da tecnologia de reconhecimento de voz é “em última análise, ajudar na comunicação entre as pessoas”. “Mesmo as pessoas que não conseguem falar podem falar usando a tecnologia. Os idosos e as pessoas com deficiência podem usar os dispositivos sem problemas com a ajuda da tecnologia de voz. uns com os outros, a comunicação aumenta.” (CEO Zhou)

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *