OpenAI revisa diretrizes sobre como modelos de IA abordam temas controversos
A OpenAI publicou uma nova versão do Model Spec, documento que define o comportamento de seus modelos. A atualização expandiu o material de 10 para 63 páginas e foi disponibilizada sob a licença CC0 (Creative Commons Zero), permitindo que qualquer pessoa o utilize ou modifique.
O documento enfatiza três princípios fundamentais: “customização”, permitindo que usuários e desenvolvedores ajustem determinados comportamentos do modelo; “transparência”, tornando mais claro como as decisões da IA são tomadas; e “liberdade intelectual”, incentivando debates e explorações de ideias sem restrições arbitrárias.
Além disso, há mudanças na forma como a IA lida com temas polêmicos. Anteriormente, a abordagem priorizava a mitigação de riscos, levando o modelo a se recusar a responder certas perguntas. Agora, a OpenAI busca que seus modelos “descubram a verdade junto com os usuários”, mantendo, ao mesmo tempo, uma postura clara contra desinformação e conteúdos prejudiciais. Outra novidade é a possibilidade de permitir certos tipos de conteúdo adulto dentro de contextos apropriados, mantendo, no entanto, restrições rígidas para conteúdos prejudiciais.
Ainda assim, há limites: usuários poderão personalizar alguns aspectos do comportamento da IA, mas não poderão remover completamente as restrições de segurança impostas pela OpenAI.
As mudanças não afetam imediatamente o comportamento do ChatGPT, mas a OpenAI afirma que refletem um progresso contínuo para tornar seus modelos mais alinhados com esses princípios. A empresa também está coletando feedback do público por meio de um formulário em seu site, com o objetivo de tornar o processo mais transparente e participativo.
Informações adicionais: The Verge (paywall)