Meta fornece um modelo de IA que pode verificar o desempenho de outros modelos de IA

A proprietária do Facebook, Meta, disse na sexta-feira que está lançando uma série de novos modelos de inteligência artificial de sua divisão de pesquisa, incluindo um “assessor autodidata” que poderia apontar o caminho para um menor envolvimento humano no processo de desenvolvimento de inteligência artificial.

Este lançamento segue a introdução da ferramenta pela Meta em um artigo de agosto que detalhou como ela se baseia na mesma técnica de “cadeia de pensamento” usada nos modelos o1 lançados recentemente pela OpenAI para permitir que ela faça julgamentos confiáveis ​​sobre modelos de reações.

Esta técnica envolve dividir problemas complexos em etapas lógicas menores e parece melhorar a precisão das respostas a problemas difíceis em assuntos como ciências, codificação e matemática.

Os metapesquisadores usaram dados inteiramente gerados por IA para treinar o modelo do avaliador, eliminando também a contribuição humana nesta fase.

A capacidade de usar IA para avaliar de forma confiável a IA fornece insights sobre um caminho possível para a construção de agentes de IA autônomos que possam aprender com seus erros, disseram à Reuters dois pesquisadores da Meta por trás do projeto.

Muitas pessoas no campo da inteligência artificial veem esses agentes como assistentes digitais, inteligentes o suficiente para realizar uma ampla gama de tarefas sem intervenção humana.

Modelos de autoaperfeiçoamento poderiam eliminar a necessidade de um processo muitas vezes caro e ineficiente usado atualmente, chamado aprendizado por reforço de feedback humano, que requer contribuições de escritores humanos que devem ter conhecimento especializado para rotular com precisão os dados e verificar se eles correspondem, eles estão corretos para matemática complexa e perguntas escritas.

“Esperamos que, à medida que a inteligência artificial se torne cada vez mais sobre-humana, ela se torne cada vez mais capaz de se testar, de modo que seja realmente melhor do que o ser humano médio”, disse Jason Weston, um dos pesquisadores.

“A ideia de ser autodidata e autoavaliador é basicamente a chave para alcançar esse tipo de nível sobre-humano de inteligência artificial”, disse ele.

Outras empresas, incluindo Google e Anthropic, também publicaram pesquisas sobre o conceito de RLAIF, ou aprendizagem por reforço a partir de feedback de IA. Porém, diferentemente da Meta, essas empresas não costumam disponibilizar seus modelos para uso público.

Outras ferramentas de IA lançadas pela Meta na sexta-feira incluíram uma atualização do modelo Segment Everything da empresa para identificação de imagens, uma ferramenta que acelera o tempo necessário para gerar respostas LLM e conjuntos de dados que podem ser usados ​​para ajudar a descobrir novos materiais inorgânicos.

©ThomsonReuters 2024

Fonte