Novembro 28, 2020

Turno Zero

Notícias Completas mundo

MIT “ressuscita” línguas perdidas usando Inteligência Artificial

Uma equipe de pesquisadores do Massachusetts Institute of Technology (MIT) desenvolveu um sistema baseado em Inteligência Artificial para ajudar os lingüistas a decifrar textos antigos.

De acordo com CNET, pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) estão trabalhando para dar nova vida às “línguas mortas” com a ajuda de Inteligência artificial. O novo sistema é capaz de decifrar automaticamente idiomas perdidos sem a necessidade de conhecimentos avançados.

O estudo, liderado pela professora Regina Barzilay, é baseado em percepções da lingüística histórica, como o fato de que as línguas só evoluem de formas previsíveis.

.js">

Um determinado idioma raramente adiciona ou exclui um som inteiramente. Em vez disso, é provável que ocorram substituições de som: a letra “p” pode mudar para “b” em algumas palavras com o tempo, por exemplo.

Junto com seu aluno de doutorado Jiaming Luo, Barzilay desenvolveu um algoritmo, baseado em aprendizado de máquina, que registra padrões de mudança de linguagem. O sistema pode, portanto, segmentar palavras em um idioma antigo e mapeá-los em um idioma relacionado.

De acordo com liberação no MIT, este projeto é baseado em um artigo, escrito no ano passado, descrevendo um programa, criado pelos pesquisadores, que decifrou as línguas mortas do ugarítico e do Linear B.

Muitos idiomas são considerados perdidos porque não há conhecimento suficiente sobre sua gramática, vocabulário ou sintaxe. Este novo algoritmo pode até avaliar a proximidade entre as duas línguas e, quando testado em línguas conhecidas, o sistema também pode identificar famílias de línguas.

No futuro, a equipe quer expandir seu trabalho para identificar o significado semântico das palavras, mesmo que ainda não sejam legíveis. Em última análise, os pesquisadores esperam ser capazes de “Ressuscitar” línguas perdidas usando apenas alguns milhares de palavras.