Concordo que as entradas atuais limitam o aprendizado da rede, ela só consegue seguir em direção a comida, sem levar em conta a disposição do seu corpo no tabuleiro.
Acho que daria pra substituir as 4 entradas atuais por apenas uma: o ângulo em radianos formado entre a cabeça da cobra e a comida.
Também daria pra dividir o tabuleiro em 4 quadrantes e passar pra rede a porcentagem de células vazias em cada quadrante, fazendo ela aprender uma estratégia para levar em conta a disposição do seu corpo no tabuleiro.
Obrigado pelo comentário!