Executando verificação de segurança...
10

Intuição e aleatoriedade - exemplo de "regressão à média"

Transcrição

"Em 2002, O Prêmio Nobel de economia foi concedido a um cientista chamado Daniel Kahneman. Hoje em dia, os economistas fazem todo tipo de coisa - explicam porque os professores recebem salários tão baixos, porquê os times de futebol valem tanto dinheiro e porque as funções corporais ajudam a estabelecer um limite para o tamanho das criações de porcos (um porco produz de três a cinco vezes mais excrementos que uma pessoa, portanto uma fazendinha com milhares de porcos costuma produzir mais detritos que as cidades vizinhas). Apesar das grandes pesquisas feitas por economistas, o Nobel de 2002 foi excepcional, porque Kahneman não é economista. É psicólogo, e durante décadas, ao lado do falecido Amos Tversky, estudou e esclareceu os tipos de percepções equivocadas sobre a aleatoriedade que alimentam muitas das falácias comuns de que falarei neste livro.

O maior desafio à compreensão do papel da aleatoriedade na vida é o fato de que, embora os princípios básicos dela surjam da lógica cotidiana, muitas das consequências que se seguem a esses princípios provam-se contra intuitivas. Os próprios estudos de Kahneman e Tversky foram desencadeados por um evento aleatório. Em meados dos anos 1960, Kahneman, que começava então sua carreira como professor de Universidade Hebraica, concordou em realizar um trabalho pouco emocionante: dar aulas a um grupo de instrutores de voo da Aeronáutica israelense sobre os pressupostos convencionais das mudanças de comportamento e suas aplicações à psicologia do treinamento de voo. Ele deixou claro de que a estratégia de recompensar comportamentos positivos funciona bem, ao contrário da de punir equívocos. Um de seus alunos o interrompeu, expressando uma opinião que acabaria por levar o cientista a uma epifania e por guiar suas pesquisas pelas décadas seguintes.

"Muitas vezes elogiei entusiasticamente meus alunos por manobras muito bem executadas, e na vez seguinte sempre se saíram pior", disse o instrutor de voo. "E já gritei com eles por manobras mal executadas, e geralmente melhoram na vez seguinte. Não venha me dizer que a recompensa funciona e a punição não. Minha experiência contradiz essa ideia." Os outros instrutores concordaram. Para Kahneman, a experiência deles parecia genuína. Por outro lado, ele acreditava nos experimentos com animais que demonstravam que a recompensa funcionava melhor que a punição. Ele meditou sobre esse aparente paradoxo. E então se deu conta: os gritos precediam a melhora, porém, ao contrário do que parecia, não a causavam.

Como era possível? A resposta se encontra num fenômeno chamado regressão à média. Isto é, em qualquer série de eventos aleatórios, há uma grande probabilidade de que um acontecimento extraordinário seja seguido, em virtude puramente do acaso, por um acontecimento mais corriqueiro. Funciona assim: cada aprendiz possui uma certa habilidade pessoal para pilotar jatos de caça. A melhora em seu nível de habilidade envolve diversos fatores e requer ampla prática; portanto, embora sue habilidade esteja melhorando lentamento ao longo do treinamento, a variação não será perceptível de uma manobra para a seguinte. Qualquer desempenho especialmente bom ou ruim será, em sua maior parte, uma questão de sorte. Assim, se um piloto fizer um pouso excepcionalmente bom, bem acima do seu nível normal de performance, haverá uma boa chance de que, no dia seguinte, essa performance se aproxime mais da norma - ou seja, piore. E se o instrutor tiver elogiado, ficará com a impressão de que o elogio não teve efeito positivo. Porém, se um piloto fizer um pouso excepcionalmente ruim - derrapar com o avião no fim da pista, entrando no tonel de sopa da lanchonete da base -, haverá uma boa chance de que, no dia seguinte, sua performance se aproxime mais da norma - ou seja, melhore. E se seu instrutor estiver o hábito de gritar "Seu jegue estabanado!", sempre que algum aluno tiver um desempenho ruim, ficará com a impressão de que a crítica teve efeito positivo. Dessa maneira surgiria um aparente padrão: aluno faz boa manobra, elogio tem efeito negativo; aluno faz manobra ruim, instrutor compara aluno a asinino em altor brados, aluno melhora. A partir de tais experiências, os instrutores concluíram que seus gritos constituíam uma eficaz ferramenta educacional. Na verdade, não faziam nenhuma diferença. [...]"

Nota

Esse é um trecho que tirei do livro O Andar do Bêbado, de Leonard Mlodinow. Estava lendo e achei esse início extremamente interessante, ao passo que quis salvá-lo no meu site pessoal. E achei interessante trazê-lo aqui também.

Quem se interessou, leia o livro! Ainda não acabei estou na metade, mas até aqui estou amando.

Referência

Mlodinow, Leonard. O Andar do Bêbado ISBN-13 9788537801550. 2009. p.15-16

Carregando publicação patrocinada...
1
1

Raramente dou os 3 votos possíveis (imediatamente) em algo, mas esse mereceu, apesar de ser só uma reprodução de algo, mas muito relevante para todos.


Farei algo que muitos pedem para aprender a programar corretamente, gratuitamente. Para saber quando, me segue nas suas plataformas preferidas. Quase não as uso, não terá infindas notificações (links aqui).

1

Obrigado! Pretendo trazer mais posts sobre o assunto conforme for lendo, falar mesmo sobre e dar mais exemplos, não apenas transcrições kkk

Enquanto isso, recomendo muito a leitura.

1

Fantástico. Interessante como a aleatoriedade também é usada até para o treinamento de inteligências artificiais com aprendizagem de reforço. No início do treinamento de uma IA que joga xadrez, por exemplo, lances bons e ruins são aleatoriamente escolhidos. Essa aleatoriedade continua até o fim do treinamento, mas com base nos pesos ajustados. Ou seja, a IA vai ficando melhor e a diferença de qualidade entre os lances não se torna mais tão aparente. Mas a aleatoriedade da escolha ainda está lá.

1

Não entendo muito sobre IA e IAs no Xadrez, mas ao que me parecia era que robôs de xadrez tentava prever as jogadas seguintes e o desenrolar das jogadas, depois fazia a jogada que tinha chance de dar a maior pontuação baseando-se nesse catálogo de jogadas possíveis. Essa é uma impressão superficial minha que tive vendo um bot de xadrez funcionando (no lichess), não pesquisei mais a fundo.

A meu ver, seguido essa lógica acima, nem precisaria de um treinamento, é um algorítimo "linear" (se é que esse seria o termo correto?).

Enquanto eu escrevia, parando pra pensar, esse algorítimo que descrevi é quase que um brute force de jogadas possíveis. Enfim, vou pesquisar mais sobre.

1

Eu estou me referindo ao processo de aprendizado de um modelo, e não do algoritmo clássico de pesquisa e avaliação de jogadas em um programa de xadrez.

Esses algoritmo "linear" referido por você é chamado de minimax. Dá uma olhadinha nisso.

1
0
1
1