Executando verificação de segurança...
1

Fantástico. Interessante como a aleatoriedade também é usada até para o treinamento de inteligências artificiais com aprendizagem de reforço. No início do treinamento de uma IA que joga xadrez, por exemplo, lances bons e ruins são aleatoriamente escolhidos. Essa aleatoriedade continua até o fim do treinamento, mas com base nos pesos ajustados. Ou seja, a IA vai ficando melhor e a diferença de qualidade entre os lances não se torna mais tão aparente. Mas a aleatoriedade da escolha ainda está lá.

Carregando publicação patrocinada...
1

Não entendo muito sobre IA e IAs no Xadrez, mas ao que me parecia era que robôs de xadrez tentava prever as jogadas seguintes e o desenrolar das jogadas, depois fazia a jogada que tinha chance de dar a maior pontuação baseando-se nesse catálogo de jogadas possíveis. Essa é uma impressão superficial minha que tive vendo um bot de xadrez funcionando (no lichess), não pesquisei mais a fundo.

A meu ver, seguido essa lógica acima, nem precisaria de um treinamento, é um algorítimo "linear" (se é que esse seria o termo correto?).

Enquanto eu escrevia, parando pra pensar, esse algorítimo que descrevi é quase que um brute force de jogadas possíveis. Enfim, vou pesquisar mais sobre.

1

Eu estou me referindo ao processo de aprendizado de um modelo, e não do algoritmo clássico de pesquisa e avaliação de jogadas em um programa de xadrez.

Esses algoritmo "linear" referido por você é chamado de minimax. Dá uma olhadinha nisso.