Parabéns pela iniciativa, fiz a mesma coisa quando comecei aprender redes neurais há um bom tempo atrás. Eu trabalho com isso atualmente e deixo aqui esse site que contém bastante conteúdo sobre redes neurais: https://d2l.ai/, é o que a gente usa para treinar os estagiários no início.
Além disso, se você quiser ir mais a fundo nesse seu trabalho, eu recomendo você aprender sobre números duais: https://blog.demofox.org/2014/12/30/dual-numbers-automatic-differentiation/
Basicamente toda framework, PyTorch/TensorFlow/PaddlePaddle, usam isso para o cálculo dos gradientes.