Estamos ficando sem palavras.
Verdadeiros. Escrito por humanos reais. O cronograma é mais apertado do que pensávamos, alguns especialistas dizem que terminará no final deste ano. O que acontece a seguir é uma bagunça chamada colapso do modelo. As máquinas comem o próprio rabo, sintetizam novos dados a partir do lixo antigo e então começam a mentir. Não apenas respostas erradas. Fabricação total.
Isso não é irritante apenas para um chatbot.
Se um LLM em execução em um hospital começar a diagnosticar erroneamente o câncer porque seus dados de treinamento enfraqueceram, você terá uma ameaça existencial em suas mãos. Yasser Roudi, do King’s College London, diz que os riscos não poderiam ser maiores.
“Se durante o treinamento de outro modelo eles experimentassem o colapso do modelo, essas máquinas poderiam diagnosticar erroneamente as pessoas.”
Ele não disse poderia como se fosse um talvez.
Então, como podemos impedir que caia no absurdo? A resposta é surpreendentemente simples. Basta adicionar um ponto de dados humanos.
Nem um bilhão. Um.
O deslize para o absurdo
Já vemos pequenos sinais. ChatGPT dando respostas suaves e suaves. Alucinações. Fatos que parecem certos, mas não são. Quando os LLMs treinam com dados produzidos por outros LLMs, tudo fica homogeneizado. As bordas estranhas desaparecem. A variação é comida viva.
O colapso precoce parece um texto chato e genérico. O estágio final é algo sem sentido.
Ninguém quer um modelo que pensa que o sol nasce no oeste apenas para preencher um limite simbólico. Mas rastrear isso em sistemas massivos é como encontrar uma agulha num palheiro digital. É muito grande. Muito caótico.
Pequenos modelos, grandes verdades
Os investigadores – equipas do King’s College London, da Universidade Norueguesa de Ciência e Tecnologia e do Centro Abdus Salam de Itália – deram um passo atrás. Eles não olharam para os monstros. Eles analisaram famílias exponenciais. Modelos de probabilidade menores.
Pense em lançamentos de moedas. Curvas de sino.
Matemática que você pode realmente manter.
Ao estudar esses modelos tratáveis, eles encontraram o mecanismo por trás da decadência. O “porquê”. E eles encontraram a cura. Não importa quanto resíduo sintético esteja no ciclo de treinamento, mesmo que 99,9% seja feito por máquina, o sistema permanece são enquanto houver uma única âncora para a verdade básica.
Uma imagem real classificada por um ser humano real.
Apenas um.
Este ponto de dados externo atua como um poço gravitacional para a realidade. Isso puxa a distribuição de volta para onde mora a verdade. Os pesquisadores publicaram isso na revista Physical Review Letters em maio, provando a teoria matematicamente.
Próximos passos?
A implantação no mundo real é outra história. Ainda não vimos uma grande IA enlouquecer completamente em público. Recebemos principalmente poemas estranhos e processos judiciais falsos. Mas a matemática não mente. A deriva está aí.
Roudi quer testar isso em feras maiores agora. Aqueles que administram a internet. Se isso acontecer, mudará tudo para os engenheiros de IA que estão construindo a próxima geração de ChatGPTs. Eles não precisam mais de conjuntos de dados humanos intermináveis. Âncoras suficientes.
É uma defesa estranha.
Uma voz humana num coro de ecos digitais é suficiente para manter a música reconhecível.
Por quanto tempo podemos manter esse tópico?
