OpenAI está permitindo que alguns usuários experimentem um novo recurso ChatGPT que usa seu inteligência artificial para operar um navegador da web para reservar viagens, comprar mantimentos, procurar pechinchas e realizar muitas outras tarefas online.
A nova ferramenta, chamada Operador, é um agente de IA: depende de um modelo de IA treinado em texto e imagens para interpretar comandos e descobrir como usar um navegador da web para executá-los. A OpenAI afirma que tem potencial para automatizar muitas tarefas diárias e tarefas do dia de trabalho.
Operador da OpenAI segue lançamentos rivais de ambos Google e Antrópicos, que possuem demonstrados capaz de usar a web. Agentes de IA são amplamente visto como o próximo estágio evolutivo para IA seguindo chatbots, e muitas empresas embarcaram no trem da moda divulgando-os. Na maioria dos casos, eles são muito limitados em suas habilidades e simplesmente usam um modelo de linguagem para automatizar coisas normalmente feitas com software normal.
“A IA está evoluindo de uma ferramenta que poderia responder às suas perguntas para uma que também é capaz de agir no mundo, realizando fluxos de trabalho complexos e de várias etapas”, afirma Peter Welinder, vice-presidente de produto da OpenAI. “Veremos um grande impacto na produtividade das pessoas, mas também na qualidade do trabalho que as pessoas serão capazes de realizar.”
A OpenAI admite que dar acesso ao ChatGPT a um navegador da web apresenta novos riscos e diz que o Operador às vezes pode se comportar mal. Afirma que implementou várias novas salvaguardas e planos para ampliar gradualmente as capacidades do Operador.
Welinder e Yash Kumar, líder de produto e engenharia do Computer Using Agent da OpenAI, dizem que o plano é aprender como as pessoas usam a ferramenta. Eles reconhecem que a ferramenta pode fazer reservas ou compras indesejadas, mas acrescentam que muito trabalho foi feito para garantir que ela pergunte antes de fazer qualquer coisa arriscada. “Ele voltará para mim e pedirá confirmações antes de tomar medidas que possam ser irreversíveis”, diz Kumar.
A OpenAI também lançou hoje um novo “cartão de sistema” descrevendo os problemas que podem surgir com o Operador. Isso inclui a possibilidade de interpretar mal os comandos ou divergir do que o usuário pede; ser mal utilizado pelos usuários; ou ser alvo de cibercriminosos.
“Isso também representa uma quantidade incrível de desafios de segurança”, diz Kumar. “Porque a área do vetor de ataque e a área do vetor de risco aumentam significativamente.”
O Operador estará inicialmente disponível como uma “prévia de pesquisa” para usuários do ChatGPT com uma conta Pro, que custa US$ 200 por mês. A empresa afirma que planeja expandir o acesso enquanto lança a ferramenta lentamente, pois inevitavelmente cometerá alguns erros ao longo do caminho.
Em diversas demonstrações, o Operator mostrou o potencial da IA para assumir um papel mais ativo como ajudante da web. A ferramenta possui um navegador remoto e uma janela de bate-papo para comunicação com o usuário.
A pedido da WIRED, a Operadora foi solicitada a reservar uma viagem de trem Amtrak de New Haven, Connecticut, para Washington, DC. Ele foi ao site certo e inseriu corretamente as informações necessárias para abrir o horário, depois solicitou mais instruções. Se um usuário estivesse conectado ao site da Amtrak ou em um perfil de navegador com informações de cartão de crédito armazenadas, a Operadora poderia prosseguir e reservar uma passagem – embora tenha sido projetada para pedir permissão primeiro.
Kumar pediu ao Operador que reservasse uma mesa no Beretta, um restaurante em São Francisco. O programa acessou o site OpenTable, encontrou o restaurante correto e pesquisou a disponibilidade antes de perguntar o que fazer a seguir. A OpenAI afirma ter feito parceria com vários sites populares, incluindo o OpenTable, para garantir que o Operator funcione sem problemas neles.
A nova ferramenta é baseada no modelo GPT-4o AI da OpenAI, que pode perceber um navegador e uma página da web e conversar em texto digitado. A ferramenta incorpora treinamento adicional desenvolvido para ajudá-lo a entender como executar tarefas online. A OpenAI também disponibilizará seu Agente de Uso de Computador por meio de sua API.