Este cérebro robótico de código aberto pensa em 3D

Roboticistas europeus hoje lançou um poderoso código aberto inteligência artificial modelo que funciona como um cérebro para a indústria robôs– ajudando-os a compreender e manipular coisas com nova destreza.

O novo modelo, LANÇA-1foi desenvolvido por pesquisadores do Instituto de Ciência da Computação, Inteligência Artificial e Tecnologia (INSAIT) da Bulgária. Pode ajudar outros pesquisadores e startups a construir e experimentar hardware mais inteligente para fábricas e armazéns.

Assim como os modelos de linguagem de código aberto possibilitaram que pesquisadores e empresas experimentassem IA generativa, Martin Vechev, cientista da computação do INSIAT e ETH Zurique, diz que o SPEAR-1 deve ajudar os roboticistas a experimentar e iterar rapidamente. “Modelos de peso aberto são cruciais para o avanço da IA incorporada”, disse Vechev à WIRED antes do lançamento.

O SPEAR-1 difere dos modelos de base de robôs existentes porque incorpora dados 3D em seu mix de treinamento. Isso dá ao modelo uma compreensão aprimorada do mundo físico, facilitando a compreensão de como os objetos se movem no espaço físico.

Os modelos básicos de robôs são geralmente construídos com base em modelos de linguagem de visão (VLMs), que têm uma compreensão ampla, mas limitada, do mundo físico porque o treinamento tende a vir de imagens 2D rotuladas. “Nossa abordagem aborda a incompatibilidade entre o espaço 3D em que o robô opera e o conhecimento do VLM que forma o núcleo do modelo de base robótica”, diz Vechev.

O SPEAR-1 é quase tão capaz quanto os modelos comerciais projetados para operar robôs, quando medido na RoboArena, uma referência que testa a capacidade de um modelo de fazer um robô fazer coisas como apertar um frasco de ketchup, fechar uma gaveta e grampear pedaços de papel.

A corrida para tornar os robôs mais inteligentes já começou bilhões de dólares montando nele. O potencial comercial de robôs geralmente capazes gerou startups bem financiadas, incluindo Separar e Generalista além do mais Inteligência Física. SPEAR-1 é quase tão bom quanto Pi-0.5 da Physical Intelligence, uma startup de bilhões de dólares fundada por uma equipe renomada de pesquisadores de robótica.

SPEAR-1 sugere que a busca para construir robôs mais inteligentes pode envolver modelos fechados, como os da OpenAI, Google e Anthropic, bem como variantes de código aberto, como Llama, DeepSeek e Qwen.

A inteligência robótica ainda está em sua infância. É possível treinar um modelo de IA para operar um braço robótico para que ele possa pegar certos objetos de uma mesa com segurança. Na prática, porém, o modelo precisará ser retreinado do zero se um tipo diferente de braço robótico for usado ou se o objeto ou o ambiente forem alterados.

Source link