Sam Altman diz que os odiadores do GPT-5 erraram tudo errado

Lançamento de agosto do Openai do seu grande modelo de linguagem GPT-5 foi um desastre. Houve falhas durante a transmissão ao vivo, com os gráficos de geração de modelos com números obviamente imprecisos. Em uma AMA do Reddit com funcionários do Openai, usuários reclamou que o novo modelo não era amigável e pediu que a empresa restaurasse a versão anterior. Acima de tudo, os críticos agarraram isso GPT-5 Não ficou aquém das expectativas estratosféricas de que o OpenAI tem suco há anos. Prometido como um divisor de águas, o GPT-5 pode ter realmente jogado melhor o jogo. Mas ainda era o mesmo jogo.

Os céticos apreenderam no momento de proclamar o fim do boom da AI. Alguns até previram o início de outro inverno de IA. “O GPT-5 foi o sistema de IA mais animado de todos os tempos”, disse-me o Popper de Bubble-Popper em tempo integral, Gary Marcus, durante sua agenda lotada de voltas de vitória. “Era para entregar duas coisas, a AGI e a cognição no nível de doutorado, e não entregou nenhum deles.” Além disso, ele diz, o novo modelo aparentemente sem brilho é a prova de que o ingresso da OpenAI para a AGI – dimensivamente ampliando dados e conjuntos de chips para tornar seus sistemas exponencialmente mais inteligentes – não podem mais ser perfurados. Pela primeira vez, as opiniões de Marcus foram ecoadas por uma parte considerável da comunidade de IA. Nos dias seguintes, o GPT-5 parecia a versão da New Coca da AI.

Sam Altman não está tendo isso. Um mês após o lançamento, ele entra em uma sala de conferências na nova sede da empresa no bairro de Mission Bay de São Francisco, ansioso para me explicar e minha colega Kylie Robison que o GPT-5 é tudo o que ele estava divulgando, e tudo está bem em sua busca épica por AGI. “As vibrações foram meio ruins no lançamento”, ele admite. “Mas agora eles são ótimos.” Sim, ótimo. É verdade que a crítica diminuiu. De fato, a empresa lançamento recente de uma ferramenta alimentar para gerar uma impressionante videoclipe AI desviar a narrativa da decepcionante estreia do GPT-5. A mensagem de Altman, no entanto, é que os opositores estão do lado errado da história. A jornada para AGI, ele insiste, ainda está no caminho certo.

Jogo de números

Os críticos podem ver o GPT-5 como o fim de um verão de IA, mas Altman e Team argumentam que ele cimenta a tecnologia da IA como um tutor indispensável, uma fonte de informação de matar o engenheiro de pesquisa e, especialmente, um sofisticado colaborador para cientistas e codificadores. Altman afirma que os usuários estão começando a vê -lo. “O GPT-5 é a primeira vez que as pessoas estão, ‘sagrada foda. Está fazendo essa importante peça de física’. Ou um biólogo está dizendo: ‘Uau, isso realmente me ajudou a descobrir isso’ “, diz ele. “Há algo importante acontecendo que não aconteceu com nenhum modelo pré-GPT-5, que é o começo da IA ajudando a acelerar a taxa de descobrir uma nova ciência”. (Openi não citou quem são esses físicos ou biólogos.)

Então, por que a recepção inicial morna? Altman e sua equipe superaram vários motivos. Primeiro, eles dizem que, desde que o GPT-4 chegou às ruas, a empresa entregou versões que foram transformacionais, particularmente os sofisticados modos de raciocínio que acrescentaram. “O salto de 4 para 5 foi maior do que o salto de 3 para 4 ”, diz Altman.” Acabamos de tivemos muitas coisas ao longo do caminho. ” O presidente do Openai, Greg Brockman, concorda: “Não estou chocado que muitas pessoas tivessem essa reação (desapontada), porque estamos mostrando nossa mão”.

O Openai também diz que, como o GPT-5 é otimizado para usos especializados, como fazer ciência ou codificação, os usuários do cotidiano estão demorando um pouco para apreciar suas virtudes. “A maioria das pessoas não é pesquisador de física”, observa Altman. Como Mark Chen, o chefe de pesquisa da Openai, explica isso, a menos que você seja um giro de matemática, você não se importará muito com o GPT-5 nos cinco primeiros olímpicos de matemática, enquanto no ano passado o sistema ficou entre os 200 melhores.

Quanto à acusação sobre como o GPT-5 mostra que a escala não funciona, o Openai diz que vem de um mal-entendido. Ao contrário dos modelos anteriores, o GPT-5 não recebeu seus principais avanços de um conjunto de dados massivamente maior e toneladas mais computação. O novo modelo obteve seus ganhos com o aprendizado de reforço, uma técnica que depende de seres humanos especializados que lhe dão feedback. Brockman diz que o OpenAI havia desenvolvido seus modelos a ponto de produzir seus próprios dados para alimentar o ciclo de aprendizado de reforço. “Quando o modelo é burro, tudo o que você quer fazer é treinar uma versão maior”, diz ele. “Quando o modelo é inteligente, você deseja provar dele. Você deseja treinar seus próprios dados.”

Source link