Executando verificação de segurança...
2

OpenAI anuncia modelo “o1”, anteriormente referido como “Strawberry”, com habilidades de raciocínio

A tecnologia foi projetada para responder perguntas complexas e de maneira mais rápida que os humanos. O lançamento inclui também o o1-mini, uma versão menor e mais econômica.

O modelo demonstrou melhorias na escrita de código e na resolução de problemas multietapas em comparação com os anteriores, embora ainda esteja descrito como uma “prévia”.

Usuários do ChatGPT “Plus” e “Team” já têm acesso ao o1-preview e ao o1-mini, enquanto os usuários “Enterprise” e “Edu” poderão acessá-los no início da próxima semana. A OpenAI planeja oferecer acesso ao o1-mini a todos os usuários gratuitos do ChatGPT, mas ainda não definiu uma data específica para isso.

Para desenvolvedores, a API do o1-preview tem um custo de 15 dólares por 1 milhão de tokens de entrada (ou pedaços de texto analisados) e 60 dólares por 1 milhão de tokens de saída. Em comparação, o GPT-4o custa 5 dólares por 1 milhão de tokens de entrada e 15 dólares por 1 milhão de tokens de saída.

O modelo foi treinado para resolver problemas de forma independente utilizando uma técnica conhecida como aprendizado por reforço, que ensina o sistema por meio de recompensas e penalidades, e emprega uma "cadeia de pensamento" para processar consultas, de maneira semelhante à resolução de problemas passo a passo feita pelos humanos, mas ainda não está livre de “alucinações”.

A principal característica que o difere do GPT-4o é sua capacidade de lidar com problemas complexos, como programação e matemática. Em testes, o o1 obteve uma taxa de acerto de 83% em um exame de qualificação para a Olimpíada Internacional de Matemática, em contraste com os 13% do GPT-4o. Em competições de programação online, como o Codeforces, o o1 superou 89% dos participantes. No entanto, o o1 tem limitações em termos de conhecimento factual sobre o mundo e não possui capacidade para navegar na web ou processar arquivos e imagens.

A empresa nomeou o modelo "o1" para simbolizar um “reset” do contador de volta para 1.

Carregando publicação patrocinada...
3

Engraçado que pedi para o ChatGPT 4, fazer uma cadeia de pensamento para responder quantos r tem strawberry e ele respondeu certo.

Ou seja a depender da pergunta, usar a cadeia de pensamento já aumenta a precisão das respostas.

1

Exatamente, basicamente o "OpenAI o1" e sua família (o1-preview, o1-mini, o1) é um modelo que vem antes de modelos como GPT-4o etc. Mas com essa habilidade de criar uma árvode de raciocínio de forma eficaz. Basicamente é um modelo como os outros porém com essa habilidade. Não há muita "mágica" por tráz, ai como ele é lento, coloca que ele está "pensando". #Marketing

2

Me questiono fortemente de onde veio o "Raciocinio". Provavelmente um casca em prolog, fortran para fazer cálculos e essas coisas. Ou seria um runtime estilo wolverine.

Porém de forma alguma é uma "revolução" no campo de AI porque não vimos nenhum paper no nível de "attention is all you need" que tornaria possível algo assim