Anthropic anuncia programa de recompensas de até 15 mil dólares para usuários que identificarem vulnerabilidades em seus modelos
O objetivo é aproveitar o conhecimento da comunidade para aprimorar a segurança das tecnologias antes de disponibilizá-las amplamente.
Recompensas mais altas serão oferecidas para quem descobrir vulnerabilidades graves, especialmente aquelas que possam ser exploradas em áreas de alto risco, como ameaças químicas, biológicas, radiológicas, nucleares e de cibersegurança. O programa também focará na identificação de "universal jailbreaks", que são métodos capazes de consistentemente contornar as medidas de segurança dos modelos.
As informações são do site VentureBeat.