Até logo, GPT-5. Olá, Qwen


Em uma garoa e numa tarde varrida pelo vento deste verão, visitei a sede da Rokid, uma startup que desenvolve óculos inteligentes em Hangzhou, China. Enquanto eu conversava com os engenheiros, suas palavras foram rapidamente traduzidas do mandarim para o inglês e depois transcritas para uma pequena tela translúcida logo acima do meu olho direito, usando um dos novos protótipos da empresa.

Os óculos de alta tecnologia da Rokid usam Qwen, um modelo de linguagem grande e aberto desenvolvido pela gigante chinesa do comércio eletrônico Alibaba.

Qwen – nome completo 通义千问 ou Tōngyì Qiānwèn em chinês – não é o melhor modelo de IA que existe. OpenAIde GPT-5, Googlede Gêmeos 3e Antrópicode Cláudio muitas vezes obtêm pontuações mais altas em benchmarks projetados para avaliar diferentes dimensões da inteligência da máquina. Nem Qwen é o primeiro modelo de peso aberto verdadeiramente inovador, sendo metade Lhamaque foi lançado pela gigante da mídia social em 2023.

No entanto, Qwen e outros modelos chineses – de DeepSeek, Moonshot AI, Z.ai e MiniMax – são cada vez mais populares porque são muito bons e fáceis de mexer. De acordo com HuggingFaceempresa que fornece acesso a modelos e códigos de IA, os downloads de modelos chineses abertos em sua plataforma superaram os downloads de modelos americanos em julho deste ano. DeepSeek abalou o mundo ao lançar um modelo de linguagem grande e de ponta com muito menos computação do que os rivais dos EUA, mas o OpenRouter, uma plataforma que encaminha consultas para diferentes modelos de IA, diz Qwen cresceu rapidamente em popularidade ao longo do ano para se tornar o segundo modelo aberto mais popular do mundo.

Qwen pode fazer quase tudo que você deseja com um modelo avançado de IA. Para os usuários do Rokid, isso pode incluir identificar produtos capturados por uma câmera embutida, obter instruções em um mapa, redigir mensagens, pesquisar na web e assim por diante. Como o Qwen pode ser facilmente baixado e modificado, o Rokid hospeda uma versão do modelo, ajustada para atender aos seus propósitos. Também é possível executar uma versão pequena do Qwen em smartphones ou outros dispositivos, caso a conexão com a Internet caia.

Antes de ir para a China instalei uma versão pequena do Qwen no meu MacBook Air e usei-o para praticar um pouco de mandarim básico. Para muitos propósitos, modelos de código aberto de tamanho modesto como o Qwen são tão bons quanto os gigantes que vivem dentro de grandes data centers.

A ascensão do Qwen e de outros modelos chineses de peso aberto coincidiu com tropeços de alguns modelos americanos famosos de IA nos últimos 12 meses. Quando a Meta revelou o Llama 4 em abril de 2025, o desempenho do modelo foi uma decepção, não conseguindo atingir os patamares de benchmarks populares como LM Arena. O deslize deixou muitos desenvolvedores procurando outros modelos abertos para brincar.



Source link