Sumário
O modelo de linguagem da OpenAI, GPT-3, não consegue distinguir o fato da ficção. Uma visão automatizada da web deve ajudar a inteligência artificial a fazer isso.
O enorme modelo de linguagem da OpenAI, GPT-3, é adequado para todos os tipos de tarefas de texto, mas produz repetidamente desinformação. Especialmente em tarefas que exigem conhecimento factual muito específico sobre o mundo ou cujas respostas não faziam parte do material de treinamento, o GPT-3 “alucina” regularmente informações incorretas, de acordo com a OpenAI.
Para combater essa desinformação, a OpenAI está se voltando para pesquisas na Internet: uma nova variante do GPT-3 aprendeu a pesquisar na Internet em busca de respostas.
OpenAI WebGPT procura por respostas
A variante é chamada de WebGPT e pode fazer consultas de pesquisa, seguir links, rolar páginas da Web para cima e para baixo e provar as fontes das respostas que encontra. Isso deve facilitar o fornecimento de feedback ao sistema de IA e aumentar sua precisão.
O WebGPT da OpenAI se baseia em outro trabalho da empresa em inteligência artificial segura: em setembro de 2020, uma equipe demonstrou um sistema de IA para resumos que foi aprimorado com feedback humano. Isso foi seguido em setembro de 2021 por um sistema de IA que pode resumir livros inteiros e também conta com feedback humano para otimização.
No entanto, ambos os sistemas usam adicionalmente um algoritmo que usa aprendizado por reforço para aprender as preferências humanas a partir do feedback fornecido e, em seguida, treina ainda mais o sistema de resumo. Isso reduz o feedback humano necessário e o custo associado.
WebGPT aprende com humanos e máquinas
O WebGPT também aprende com exemplos humanos, bem como com um algoritmo que analisou quais tipos de respostas as pessoas preferem a perguntas. Primeiro, o WebGPT aprende com demonstrações de uso de um navegador da Web para responder a perguntas. O feedback do segundo algoritmo melhora a precisão das respostas.
Em testes com perguntas dos conjuntos de dados ELI5 e TruthfulAQ, o desempenho do WebGPT é significativamente melhor do que o GPT-3, mas continua aquém da qualidade das respostas humanas. A abordagem é promissora. No entanto, diz OpenAI, e agora será aprimorado com treinamento adversário e debates automatizados entre vários modelos.
OpenAI alerta contra adulteração e acesso à internet
De acordo com a OpenAI, no entanto, versões melhores do WebGPT também apresentam riscos. Por exemplo, a citação automática de fontes transmite uma certa autoridade que nem sempre é apropriada porque a qualidade da fonte não é verificada. Um sistema melhor também só poderia escolher fontes que esperasse que as pessoas considerassem convincentes – mesmo que a fonte contivesse erros.
O atual WebGPT tem acesso limitado à Internet e, de acordo com uma avaliação das capacidades do GPT-3, é incapaz de abusar desse acesso. No entanto, com modelos melhores, o risco de dar a um sistema de IA acesso total à Internet aumenta, escreve OpenAI. A empresa já está, portanto, desenvolvendo mecanismos internos de segurança.