OpenAI lança agente autônomo para executar tarefas no computador
A OpenAI anunciou o Operator, um agente autônomo capaz de controlar um navegador da web e realizar ações de forma independente. Inicialmente, o sistema está disponível apenas para usuários dos EUA que assinam o plano Pro, de 200 dólares mensais, com planos de expansão para os níveis Plus, Team e Enterprise no futuro. Atualmente, o acesso ao Operator é feito pelo site “operator.chatgpt.com”, mas a OpenAI planeja integrá-lo a todos os seus clientes ChatGPT.
O Operator é projetado para automatizar tarefas como agendamento de voos, reservas em restaurantes e compras online. A interface do sistema oferece categorias de tarefas, incluindo compras, entrega, jantar e viagem, cada uma com opções específicas de automação. Os usuários podem monitorar e interagir com o progresso do Operator, já que ele utiliza um navegador dedicado para realizar suas operações.
O sistema é equipado por um agente chamado “computer-using agent” (CUA), que combina a visão avançada do modelo GPT-4o com as habilidades de raciocínio dos modelos mais sofisticados da OpenAI. O CUA foi treinado para interagir diretamente com o front-end de sites. Ele consegue clicar em botões, navegar por menus e preencher formulários, imitando o comportamento humano.
Para garantir segurança e controle, o CUA solicita confirmação do usuário antes de executar tarefas com efeitos colaterais, como enviar pedidos ou e-mails. Além disso, tarefas sensíveis, como transações bancárias, exigem supervisão direta: o usuário precisa inserir manualmente informações de cartão de crédito, por exemplo. A OpenAI reforça que o Operator não coleta nem armazena dados dos usuários.