
Eles descobriram que o sistema de IA que analisaram expressa os significados das palavras de uma maneira que se assemelha ao julgamento humano.
Modelos para processamento de linguagem natural usam estatísticas para coletar uma grande quantidade de informações sobre os significados das palavras.
Em “Through the Looking Glass”, Humpty Dumpty diz com desdém: “Quando uso uma palavra, ela significa exatamente o que eu escolho que ela signifique – nem mais nem menos”. Alice responde: “A questão é se você pode fazer as palavras significarem tantas coisas diferentes”.
Os significados das palavras têm sido objeto de pesquisa há muito tempo. Para compreender seu significado, a mente humana deve classificar através de uma complexa rede de informações flexíveis e detalhadas.
Agora, uma questão mais recente com o significado das palavras veio à tona. Os pesquisadores estão analisando se as máquinas com inteligência artificial seriam capazes de imitar os processos de pensamento humanos e compreender palavras de forma semelhante. Pesquisadores da UCLA, MIT e do National Institutes of Health acabam de publicar um estudo que responde a essa pergunta.
O estudo, publicado na revista Natureza Comportamento Humano, demonstra que os sistemas de inteligência artificial podem realmente captar significados de palavras altamente complexos. Os pesquisadores também encontraram um método simples para obter acesso a essas informações sofisticadas. Eles descobriram que o sistema de IA que analisaram representa os significados das palavras de uma maneira que se assemelha ao julgamento humano.
O sistema de IA explorado pelos autores tem sido amplamente utilizado para analisar o significado das palavras ao longo da última década. Ele capta os significados das palavras “lendo” enormes quantidades de material na internet, que contém dezenas de bilhões de palavras.

Uma representação da projeção semântica, que pode determinar a semelhança entre duas palavras em um contexto específico. Esta grade mostra como certos animais são semelhantes com base em seu tamanho. Crédito: Idan Blank/UCLA
Quando as palavras ocorrem frequentemente juntas – “mesa” e “cadeira”, por exemplo – o sistema aprende que seus significados estão relacionados. E se pares de palavras ocorrem juntos muito raramente – como “mesa” e “planeta” – ele descobre que eles têm significados muito diferentes.
Essa abordagem parece um ponto de partida lógico, mas considere quão bem os humanos entenderiam o mundo se a única maneira de entender o significado fosse contar com que frequência as palavras ocorrem próximas umas das outras, sem qualquer capacidade de interagir com outras pessoas e nosso ambiente.
Idan Blank, professor assistente de psicologia e linguística da UCLA e co-autor principal do estudo, disse que os pesquisadores decidiram aprender o que o sistema sabe sobre as palavras que aprende e que tipo de “senso comum” ele tem.
Antes do início da pesquisa, disse Blank, o sistema parecia ter uma grande limitação: “No que diz respeito ao sistema, cada duas palavras têm apenas um valor numérico que representa o quão semelhantes são”.
Em contraste, o conhecimento humano é muito mais detalhado e complexo.
“Considere nosso conhecimento sobre golfinhos e jacarés”, disse Blank. “Quando comparamos os dois em uma escala de tamanho, de ‘pequeno’ a ‘grande’, eles são relativamente semelhantes. Em termos de inteligência, eles são um pouco diferentes. Em termos do perigo que representam para nós, em uma escala de ‘seguro’ a ‘perigoso’, eles diferem muito. Assim, o significado de uma palavra depende do contexto.
“Queríamos perguntar se esse sistema realmente conhece essas diferenças sutis – se sua ideia de semelhança é flexível da mesma forma que é para humanos”.
Para descobrir, os autores desenvolveram uma técnica que chamam de “projeção semântica”. Pode-se traçar uma linha entre as representações do modelo das palavras “grande” e “pequeno”, por exemplo, e ver onde as representações de diferentes animais caem nessa linha.
Usando esse método, os cientistas estudaram grupos de 52 palavras para ver se o sistema poderia aprender a classificar os significados – como julgar os animais pelo tamanho ou quão perigosos são para os humanos, ou classificar os estados dos EUA pelo clima ou pela riqueza geral.
Entre os outros agrupamentos de palavras estavam termos relacionados a roupas, profissões, esportes, criaturas mitológicas e nomes próprios. Cada categoria recebeu vários contextos ou dimensões – tamanho, perigo, inteligência, idade e velocidade, por exemplo.
Os pesquisadores descobriram que, nesses muitos objetos e contextos, seu método se mostrou muito semelhante à intuição humana. (Para fazer essa comparação, os pesquisadores também pediram a coortes de 25 pessoas cada para fazer avaliações semelhantes sobre cada um dos grupos de 52 palavras.)
Notavelmente, o sistema aprendeu a perceber que os nomes “Betty” e “George” são semelhantes em termos de serem relativamente “velhos”, mas que representavam gêneros diferentes. E que “levantamento de peso” e “esgrima” são semelhantes, pois ambos geralmente ocorrem em ambientes fechados, mas diferentes em termos de quanta inteligência eles exigem.
“É um método tão lindamente simples e completamente intuitivo”, disse Blank. “A linha entre ‘grande’ e ‘pequeno’ é como uma escala mental, e colocamos os animais nessa escala.”
Blank disse que na verdade não esperava que a técnica funcionasse, mas ficou encantado quando funcionou.
“Acontece que esse sistema de aprendizado de máquina é muito mais inteligente do que pensávamos; contém formas muito complexas de conhecimento, e esse conhecimento é organizado em uma estrutura muito intuitiva”, disse ele. “Apenas acompanhando quais palavras ocorrem umas com as outras na linguagem, você pode aprender muito sobre o mundo.”
Referência: “A projeção semântica recupera o conhecimento humano rico de recursos de múltiplos objetos a partir de incorporações de palavras” por Gabriel Grand, Idan Asher Blank, Francisco Pereira e Evelina Fedorenko, 14 de abril de 2022, Natureza Comportamento Humano.
DOI: 10.1038/s41562-022-01316-8
O estudo foi financiado pelo Gabinete do Diretor de Inteligência Nacional, Atividade de Projetos de Pesquisa Avançada de Inteligência através do Laboratório de Pesquisa da Força Aérea.
Discussion about this post