Bom dia Geovani
!
Atualmente sou Cientista de Dados, porém não fiz uma faculdade correlata ao assunto.
O que eu tenho visto por todo esse tempo é que você precisa pegar um problema de negócio e criar toda a sua base teórica.
Por exemplo (exemplo simples):
Problema de negócio: Quero prever o peso de uma pessoa baseado na idade.
Como o negócio irá usar essas informações?
Essa realmente é a necessidade dele ou ele precisa refinar a necessidade? (talvez ele queira vender um produto para pessoas de certo peso e somente tenha informação de idade)
Preciso mesmo de um modelo preditivo?
Provavelmente não, mas se por algum motivo especial é necessário usar, qual usaria?
Para esse problema específico eu usaria regressão linear de 0-18 anos, mas quais são os "assumptions" ou requerimentos do modelo para poder usá-lo?
Qual ferramenta irei utilizar para ter as respostas do modelo? (Linguagem de programação, programas, etc.)
Com essas perguntas, você vai criando o seu conhecimento teórico em Estatística, Negócios e Ciência da computação... Os três são base para a Ciência de Dados.
Existem várias plataformas com problemas específicos de negócios e uma delas é o Kaggle (nem sempre a melhor, porque nem sempre as variáveis tem informações ou as pessoas fazem análise exploratória, mas é interessante)