Opera Browser Operator surpreende em primeiros testes fechados
O recurso ainda não tem data oficial de lançamento e está indisponível ao público geral. Contudo, um jornalista teve acesso antecipado à ferramenta, antes de qualquer um fora da equipe da Opera.
Diferente de operadores como o Rabbit R1 ou o Operator da OpenAI, que utilizam processamento de linguagem natural para interpretar comandos, abrindo uma sessão de navegador remoto e capturando imagens da tela para análise por IA de visão computacional, o Browser Operator adota uma abordagem mais direta. Ele interage com o código da página, como se estivesse em modo de acessibilidade (a11y), ignorando elementos visuais desnecessários, como pop-ups e caixas de consentimento de cookies, o que o torna significativamente mais rápido.
Em um dos testes, tanto o Opera quanto o Rabbit R1 receberam a tarefa de navegar entre duas páginas da Wikipédia usando apenas os links internos. O Browser Operator concluiu o trajeto em 2 minutos e 15 segundos. Já o Rabbit levou 2 minutos e 35 segundos, se perdeu no caminho e ainda tentou contornar a tarefa utilizando a busca.
Em outro exemplo, ao ser solicitado a planejar uma viagem de bicicleta pela Europa, o Opera respondeu em apenas 15 segundos, organizando as informações em uma tabela clara e acessível. O Rabbit, por sua vez, levou 42 segundos.
Durante o planejamento, o Browser Operator enfrentou um pequeno obstáculo ao selecionar datas em um site de reservas, mas conseguiu superar a dificuldade acessando diretamente o código-fonte e utilizando menus suspensos como alternativa.
Ao assistir a um vídeo no YouTube, a IA foi capaz de pular o anúncio exatamente no segundo em que o botão apareceu — algo viável apenas por sua interação com a estrutura da página.