Executando verificação de segurança...
5

O monstro por trás da máscara da IA

Com o recente caso do Bing Chat onde o ChatBot da Microsoft ofereceu respostas um tanto quanto ásperas em uma conversa sobre o filme Avatar: O Caminho da Água (ler matéria) e a divulgação do caso no tweet do Elon Musk, ficou em alta o quanto uma Inteligência Artificial pode ser estranha e preocupante se treinada de maneira incorreta.


Inteligências artificiais baseadas no GPT-3 como o ChatGPT e o Bing Chat são treinadas em três fases:

Imagem referência
Cada parte do monstro representa uma fase do treinamento da IA.

👹 Fase 1 (Aprendizagem não supervisionada):

Na primeira fase, a inteligência lê livros e outros conteúdos da internet sozinho, aprendendo por conta própria todo o conhecimento. É como se permitisse que uma criatura andasse e consumisse o conteúdo de uma biblioteca, livre para ler o que desejar.
A primeira fase é um monstro por não ter moralidade nenhuma. Ela pode responder qualquer coisa sem filtros, inclusive o passo a passo de como cometer um crime, uma vez que foi treinada pela internet e pode encontrar sites violentos, racistas e outras bizarrices.

👨‍🦲 Fase 2 (Ajustes finos supervisionados):

Na segunda fase, começam os filtros de respostas, sendo ela representada pela cabeça de um humano na imagem. Nessa fase a IA aprende com milhares de exemplos de Inputs e Outputs, ela não interage com as perguntas e respostas, apenas análisa e armazena as possíveis perguntas e respostas esperadas por um ser humano (Ex: Se lhe perguntarem isso, você deve responder isso).

🙂 Fase 3 (RLHF):

Na terceira e última fase, representada pelo emoji, humanos ficam conversando com a IA e dando feedback em suas respostas, melhorando a taxa de respostas corretas e atrativas ao usuário, evitando que casos estranhos ocorram quando a IA for liberada para uso aberto do público. Os humanos devem seguir um Manual oficial para que as avaliações sigam padrões.
A sigla RLHF vem de Reinforcement Learning from Human Feedback ou Aprendizagem por Reforço com Feedback Humano (em português).


Um problema na execução da fase dois e três podem causar comportamos não esperados e nada atrativos aos usuários, explicando assim o motivo do ocorrido com o Bing Chat no caso citado anteriormente. Podemos enxergar como se tivessemos um vislumbre "por trás da máscara" de uma inteligência artificial, seu verdadeiro "eu" e como o filtro das fases dois e três são importantes para que as IAs não se tornem algo nocivo ao ser humano, seu usuário final.

Aviso: O conteúdo descrito acima foi inspirado em um vídeo do TikTok de @igorcoutoia.

Carregando publicação patrocinada...
2

Nossa, nunca tinha visto por este lado. Acho que há muito o que melhorar ainda o Bing Chat... Eles pensaram tanto em ter uma gigante base de dados, mas esqueceram deste detalhe.

1

Sim, precisam trabalhar melhor no RLHF, mas está disponível ainda em testes fechados (para usuários selecionados) então os erros são entendíveis.

Em breve imagino que ela terá um poder absurdo e deixará bastante registros interessantes de diálogos entre humano e inteligência artificial.

1

mas está disponível ainda em testes fechados (para usuários selecionados)

Você se refere ao Bing Chat? Eu não sei como está agora, mas eu me inscrevi no dia 08/02 e recebi o acesso no dia 27. E tenho certeza de que sou apenas um usuário "comum" rs

1

Sensacional essa ilustração. Pelo que vi, o monstro é inspirado no Shoggoth (página do autor).

Um lado pessoal é crítico dessa representação monstruosa das IAs, pois traz uma certa interpretação (rasa, na minha opinião) de que são intrinsecamente ruins. Mas outro lado não consegue negar que a ideia dessas IAs como criaturas misteriosas, incrivelmente poderosas, mas também terríveis (tal como as entidades divinas do Lovecraft), fazem um razoável sentido.

1
1
1

Imaginem agora que essas fases dois e três dependem da etica da empresa ou governo que estiver por trás da IA...

Ai comecamos a pensar o seguinte:

  • Faria todo o sentido uma BELA regulação estatal em cima dessas empresas. Mas, quem fiscaliza o fiscal? Nossas experiencias passadas e atuais mostram como o Estado é fragil a lobbies e loucos totalitarios no poder. Imagina só a chave do galinheiro nas mãos dessa galera.

  • Outro pensamento: a livre concorrência nos salvará, afinal, quem pagaria por por uma IA que vai nos matar? Quem pagaria por qualquer coisa que vai nos matar? Ai basta lembrar da nicotina e de todo o marketing feito em cima dela no seculo 20 pra chegarmos a conclusao que sim, pagaríamos e bem por algo que no fim. nos mataria (e to usando a nicotina aqui como exemplo pq é uma "unanimidade". Poderia citar outras dez industrias, pelo menos, e seus fãs apareceriam aqui nos comentários causando confusão e desvirtuando o proposito da plataforma. Mas isso provaria o meu argumento...).

Enfim: a IA ja está entre nós e isso é irreversível. E parece nao haver uma solução mágica para cercar seus limites.

O seculo 21 promete. E os demais, também.