O novo modelo de tradução ultrarrápido da Mistral dá aos grandes laboratórios de IA uma corrida pelo seu dinheiro

Mistral AI tem lançou uma nova família de IA modelos que afirma abrirão o caminho para uma conversa contínua entre pessoas falando línguas diferentes.

Na quarta-feira, o laboratório de IA com sede em Paris lançou dois novos modelos de fala para texto: Voxtral Mini Transcribe V2 e Voxtral Realtime. O primeiro foi desenvolvido para transcrever arquivos de áudio em grandes lotes e o último para transcrição quase em tempo real, em 200 milissegundos; ambos podem traduzir entre 13 idiomas. Voxtral Realtime está disponível gratuitamente sob uma licença de código aberto.

Com quatro bilhões de parâmetros, os modelos são pequenos o suficiente para serem executados localmente em um telefone ou laptop – uma inovação no campo da conversão de fala em texto, afirma Mistral – o que significa que as conversas privadas não precisam ser enviadas para a nuvem. De acordo com Mistral, os novos modelos são mais baratos de operar e menos sujeitos a erros do que as alternativas concorrentes.

Mistral apresentou o Voxtral Realtime – embora o modelo produza texto, não fala – como um passo marcante em direção a uma conversa fluente através da barreira do idioma, um problema Maçã e Google também estão competindo para resolver. O modelo mais recente do Google é capaz de traduzir com um atraso de dois segundos.

“O que estamos construindo é um sistema capaz de traduzir perfeitamente. Este modelo está basicamente lançando as bases para isso”, afirma Pierre Stock, vice-presidente de operações científicas da Mistral, em entrevista à WIRED. “Acho que esse problema será resolvido em 2026.”

Fundada em 2023 pelos ex-alunos da Meta e do Google DeepMind, a Mistral é uma das poucas empresas europeias que desenvolve modelos básicos de IA capazes de funcionar remotamente perto dos líderes do mercado americano – OpenAI, Anthropic e Google – do ponto de vista de capacidade.

Sem acesso ao mesmo nível de financiamento e computação, a Mistral concentrou-se em melhorar o desempenho através do design de modelos imaginativos e da otimização cuidadosa de conjuntos de dados de treinamento. O objetivo é que as micromelhorias em todos os aspectos do desenvolvimento do modelo se traduzam em ganhos materiais de desempenho. “Francamente, muitas GPUs deixam você preguiçoso”, afirma Stock. “Você testa muitas coisas cegamente, mas não pensa qual é o caminho mais curto para o sucesso.”

O principal modelo de linguagem grande (LLM) da Mistral não corresponde aos modelos concorrentes desenvolvido por concorrentes dos EUA para capacidade bruta. Mas a empresa conquistou um mercado ao estabelecer um compromisso entre preço e desempenho. “A Mistral oferece uma alternativa mais económica, onde os modelos não são tão grandes, mas são suficientemente bons e podem ser partilhados abertamente”, afirma Annabelle Gawer, diretora do Centro de Economia Digital da Universidade de Surrey. “Pode não ser um carro de Fórmula 1, mas é um carro familiar muito eficiente.”

Entretanto, enquanto os seus homólogos americanos investem centenas de milhares de milhões de dólares na corrida para a inteligência artificial geral, a Mistral está a construir uma lista de modelos especializados – embora menos atraentes – destinados a realizar tarefas restritas, como converter fala em texto.

“A Mistral não se posiciona como um player de nicho, mas certamente está criando modelos especializados”, afirma Gawer. “Como um player dos EUA com recursos, você quer ter uma tecnologia de uso geral muito poderosa. Você não quer desperdiçar seus recursos ajustando-os aos idiomas e especificidades de determinados setores ou geografias. Você deixa esse tipo de negócio menos lucrativo na mesa, o que cria espaço para players intermediários.”

À medida que a relação entre os EUA e os seus aliados europeus mostra sinais de deterioração, Mistral tem-se apoiado cada vez mais nas suas raízes europeias. “Há uma tendência na Europa em que as empresas e, em particular, os governos estão a olhar com muito cuidado para a sua dependência de empresas de software e IA dos EUA”, afirma Dan Bieler, analista principal da empresa de consultoria de TI PAC.

Neste contexto, a Mistral posicionou-se como o par de mãos mais seguro: uma alternativa nativa europeia, multilingue e de código aberto aos modelos proprietários desenvolvidos nos EUA. “A pergunta deles sempre foi: como construímos uma posição defensável num mercado que é dominado por atores americanos altamente financiados?” diz Raphaëlle D’Ornano, fundadora da empresa de consultoria tecnológica D’Ornano + Co. “A abordagem que a Mistral adotou até agora é que eles querem ser a alternativa soberana, em conformidade com todas as regulamentações que possam existir na UE.”

Embora a disparidade de desempenho em relação aos pesos pesados americanos se mantenha, à medida que as empresas enfrentam a necessidade de encontrar um retorno sobre o investimento em IA e de ter em conta o contexto geopolítico, os modelos mais pequenos ajustados aos requisitos específicos da indústria e da região terão o seu dia, prevê Bieler.

“Os LLMs são os gigantes que dominam as discussões, mas não contaria que essa situação durasse para sempre”, afirma Bieler. “Modelos pequenos e com foco mais regional desempenharão um papel muito maior no futuro.”

Source link