Não entendo muito sobre IA e IAs no Xadrez, mas ao que me parecia era que robôs de xadrez tentava prever as jogadas seguintes e o desenrolar das jogadas, depois fazia a jogada que tinha chance de dar a maior pontuação baseando-se nesse catálogo de jogadas possíveis. Essa é uma impressão superficial minha que tive vendo um bot de xadrez funcionando (no lichess), não pesquisei mais a fundo.
A meu ver, seguido essa lógica acima, nem precisaria de um treinamento, é um algorítimo "linear" (se é que esse seria o termo correto?).
Enquanto eu escrevia, parando pra pensar, esse algorítimo que descrevi é quase que um brute force de jogadas possíveis. Enfim, vou pesquisar mais sobre.