OpenAI anuncia modelo “o1”, anteriormente referido como “Strawberry”, com habilidades de raciocínio
A tecnologia foi projetada para responder perguntas complexas e de maneira mais rápida que os humanos. O lançamento inclui também o o1-mini, uma versão menor e mais econômica.
O modelo demonstrou melhorias na escrita de código e na resolução de problemas multietapas em comparação com os anteriores, embora ainda esteja descrito como uma “prévia”.
Usuários do ChatGPT “Plus” e “Team” já têm acesso ao o1-preview e ao o1-mini, enquanto os usuários “Enterprise” e “Edu” poderão acessá-los no início da próxima semana. A OpenAI planeja oferecer acesso ao o1-mini a todos os usuários gratuitos do ChatGPT, mas ainda não definiu uma data específica para isso.
Para desenvolvedores, a API do o1-preview tem um custo de 15 dólares por 1 milhão de tokens de entrada (ou pedaços de texto analisados) e 60 dólares por 1 milhão de tokens de saída. Em comparação, o GPT-4o custa 5 dólares por 1 milhão de tokens de entrada e 15 dólares por 1 milhão de tokens de saída.
O modelo foi treinado para resolver problemas de forma independente utilizando uma técnica conhecida como aprendizado por reforço, que ensina o sistema por meio de recompensas e penalidades, e emprega uma "cadeia de pensamento" para processar consultas, de maneira semelhante à resolução de problemas passo a passo feita pelos humanos, mas ainda não está livre de “alucinações”.
A principal característica que o difere do GPT-4o é sua capacidade de lidar com problemas complexos, como programação e matemática. Em testes, o o1 obteve uma taxa de acerto de 83% em um exame de qualificação para a Olimpíada Internacional de Matemática, em contraste com os 13% do GPT-4o. Em competições de programação online, como o Codeforces, o o1 superou 89% dos participantes. No entanto, o o1 tem limitações em termos de conhecimento factual sobre o mundo e não possui capacidade para navegar na web ou processar arquivos e imagens.
A empresa nomeou o modelo "o1" para simbolizar um “reset” do contador de volta para 1.