Jensen Huang afirma que os novos chips Vera Rubin da Nvidia estão em “plena produção”

CEO da Nvidia, Jensen Huang diz que a plataforma de superchip de IA de próxima geração da empresa, Vera Rubin, está dentro do cronograma para começar a chegar aos clientes ainda este ano. “Hoje posso dizer que Vera Rubin está em plena produção”, disse Huang durante um evento para a imprensa na segunda-feira na feira anual de tecnologia CES em Las Vegas.

Rubin cortará o custo de executando modelos de IA para cerca de um décimo do atual sistema de chips líder da Nvidia, Blackwelldisse a empresa a analistas e jornalistas durante uma teleconferência no domingo. A Nvidia também disse que Rubin pode treinar certos modelos grandes usando cerca de um quarto da quantidade de chips necessária para a Blackwell. Tomados em conjunto, esses ganhos poderiam tornar a operação de sistemas avançados de IA significativamente mais baratos e tornar mais difícil para os clientes da Nvidia justificarem o abandono de seu hardware.

A Nvidia disse na teleconferência que dois de seus parceiros existentes, Microsoft e CoreWeave, estarão entre as primeiras empresas a começar a oferecer serviços com chips Rubin ainda este ano. Dois grandes data centers de IA que a Microsoft está construindo atualmente na Geórgia e em Wisconsin eventualmente incluirão milhares de chips Rubin, acrescentou a Nvidia. Alguns dos parceiros da Nvidia começaram a executar seus modelos de IA de próxima geração nos primeiros sistemas Rubin, disse a empresa.

A gigante dos semicondutores também disse que está trabalhando com a Red Hat, que fabrica software empresarial de código aberto para bancos, montadoras, companhias aéreas e agências governamentais, para oferecer mais produtos que rodarão no novo sistema de chip Rubin.

A mais recente plataforma de chips da Nvidia leva o nome Vera Rubinum astrônomo americano que remodelou a forma como os cientistas entendem as propriedades das galáxias. O sistema inclui seis chips diferentes, incluindo a GPU Rubin e uma CPU Vera, ambos construídos usando o processo de fabricação de 3 nanômetros da Taiwan Semiconductor Manufacturing Company e a mais avançada tecnologia de memória de largura de banda disponível. As tecnologias de interconexão e comutação de sexta geração da Nvidia conectam os vários chips.

Cada parte deste sistema de chip é “completamente revolucionária e a melhor do gênero”, proclamou Huang durante a conferência de imprensa da empresa na CES.

A Nvidia vem desenvolvendo o sistema Rubin há anos, e Huang anunciou pela primeira vez que os chips chegariam durante um discurso de abertura em 2024. No ano passado, a empresa disse que os sistemas construídos em Rubin começariam a chegar no segundo semestre de 2026.

Não está claro exatamente o que a Nvidia quer dizer ao dizer que Vera Rubin está em “plena produção”. Normalmente, a produção de chips tão avançados – que a Nvidia está construindo com seu parceiro de longa data TSMC – começa em baixo volume enquanto os chips passam por testes e validação e aumentam em um estágio posterior.

“Este anúncio da CES em torno de Rubin é para dizer aos investidores: ‘Estamos no caminho certo’”, diz Austin Lyons, analista da Creative Strategists e autor do boletim informativo da indústria de semicondutores. Chipstrat. Houve rumores em Wall Street de que a GPU Rubin estava atrasada, diz Lyons, então a Nvidia agora está recuando, dizendo que liberou as principais etapas de desenvolvimento e teste, e está confiante de que Rubin ainda está no caminho certo para começar a aumentar a produção no segundo semestre de 2026.

Em 2024, a Nvidia teve que atrasar a entrega de seus então novos chips Blackwell devido a uma falha de design que causou superaquecimento quando conectados em racks de servidores. As remessas da Blackwell voltaram ao cronograma em meados de 2025.

À medida que a indústria de IA se expande rapidamente, as empresas de software e os provedores de serviços em nuvem tiveram que competir ferozmente pelo acesso às mais novas GPUs da Nvidia. A demanda provavelmente será igualmente alta para Rubin. Mas algumas empresas também estão protegendo suas apostas investindo em seus próprios designs de chips personalizados. A OpenAI, por exemplo, disse que está trabalhando com a Broadcom para construir silício sob medida para sua próxima geração de modelos de IA. Essas parcerias destacam um risco de longo prazo para a Nvidia: os clientes que projetam seus próprios chips podem obter um nível de controle sobre seu hardware que a empresa não oferece.

Mas Lyons diz que os anúncios de hoje demonstram como a Nvidia está evoluindo além de apenas oferecer GPUs para se tornar um “arquiteto completo de sistemas de IA, abrangendo computação, rede, hierarquia de memória, armazenamento e orquestração de software”. Mesmo enquanto os hiperscaladores investem dinheiro em silício personalizado, acrescenta ele, a plataforma totalmente integrada da Nvidia “está cada vez mais difícil de substituir”.

Source link