Openai está criando uma versão menor e mais eficiente de sua mais inteligente inteligência artificial Modelo disponível gratuitamente, pois procura responder ao hype e entusiasmo em torno de uma nova oferta de código aberto da startup de IA chinesa Deepseek.
Com fio relatou anteriormente que Openai estava preparando o novo modelochamado O3-mini, para ser lançado em 31 de janeiro. Os pesquisadores da empresa têm trabalhado horas extras para prepará-lo para o horário nobre, de acordo com fontes que falaram sob a condição de anonimato.
O3-mini, que o OpenAI provou em dezembro, é uma versão menor do modelo que apresenta os recursos de raciocínio de IA mais avançados de qualquer oferta do OpenAI até o momento. O modelo pode dividir problemas difíceis em partes constituintes para descobrir a melhor forma de resolvê -las.
“Este modelo poderoso e rápido avança os limites do que os modelos pequenos podem alcançar”, disse a empresa Em uma postagem no blog anunciando a disponibilidade da O3-mini.
O OpenAI está disponibilizando o O3-mini para todos os usuários Plus, Team e Pro do ChatGPT. Os usuários da versão gratuita do ChatGPT também poderão experimentar a O3-Mini, mas não poderão enviar quantas consultas, diz a empresa.
Evidentemente, o OpenAI usa estudantes de doutorado para ajudar a treinar um novo modelo há algum tempo. Várias semanas atrás, a empresa começou a recrutar estudantes de ciência da computação de doutorado a US $ 100 por hora para uma “colaboração de pesquisa” que “envolveria trabalhar em modelos não lançados”, de acordo com um e -mail visualizado pela Wired.
O OpenAI também parece ter recrutado estudantes de doutorado com experiência em outras áreas através de uma empresa chamada Mercor que usa regularmente para encontrar funcionários para treinamento de modelos. Um recente Postação de empregos De Mercor no LinkedIn, “O objetivo geral deste projeto da qual você pode fazer parte é criar perguntas desafiadoras de codificação científica projetadas para testar as capacidades de grandes modelos de idiomas na geração de código para resolver problemas realistas de pesquisa científica”.
A publicação de emprego continua a dar um exemplo de problema que é surpreendentemente semelhante a um problema em uma referência chamada SCICODE, projetada para testar a capacidade de um grande modelos de linguagem de resolver problemas científicos complexos.
A notícia vem como R1 de Deepseek Continua a Roil a indústria de tecnologia dos EUA. O fato de um modelo tão poderoso poder ser lançado gratuitamente pressiona o Google e antropia para reduzir seus preços.
O Openai está particularmente ansioso para demonstrar que permanece na vanguarda do desenvolvimento e comercialização da IA, de acordo com fontes dentro da empresa.
O modelo gratuito de Deepseek incorpora inovações que tornaram mais eficiente treinar e servir. A empresa parece ter desenvolvido -o usando muito menos recursos do que o OpenAI e outras empresas americanas atualmente construindo modelos de IA de fronteira, embora os detalhes precisos das despesas da Deepseek permaneçam desconhecidos. Openai diz que acredita O R1 pode ter incorporado a saída de seus modelos em seu treinamento.
Tem uma dica?
Você é um funcionário atual ou ex -funcionário do Openai? Gostaríamos de ouvir de você. Usando um telefone ou computador não trabalhoso, o contato será o cavaleiro will_knight@wired.com ou no sinal através de seu nome de usuário é WAK01.
O modelo mais novo da OpenAI pode não ofuscar R1 em termos de preço, mas mostra que a empresa fará com que a eficiência parte de seu foco daqui para frente. O Openai também diz que o modelo é especialmente forte em matemática, ciências e codificação.
A empresa diz que o modelo mais recente também incorporará novos recursos, incluindo a capacidade de explorar pesquisas na Web, chamar funções do código de um usuário e alternar entre diferentes níveis de raciocínio que trocam de velocidade para obter recursos de solução de problemas.
A repentina ascensão de Deepseek também levantou questões sobre a estratégia do governo dos EUA para conter a ascensão da China na IA. As duas últimas administrações dos EUA introduziram várias sanções para reduzir a capacidade da China de acessar os chips da NVIDIA mais avançados normalmente usados para criar modelos de IA de ponta. A Deepseek descreveu vários tipos de chips da NVIDIA em sua pesquisa, mas ainda não está claro o que exatamente foi usado.