Estamos juntos FabioSmuu!!
A gente tem que criar esse conteúdo de ML mesmo na comunidade brasileira!
Sobre a parte de convergir em menos tempo por não ter valores aleatórios, não acredito que seja assim porque o backpropagation geralmente utiliza algoritmos que punem valores mais discrepantes para toda a rede.
O dropout vai servir para corrigir ainda mais esses valores discrepantes e não ocorrer um possível overfit.