Data Science precisa do seguinte, meio que por ordem de prioridade:
- o básico de uma linguagem de programação da área (Python ou R)
- BOA BASE de inteligência artificial (classificadores, aprendizado supervisionado e não-supervisionado, alguns algoritmos INCLUINDO os NÃO relacionados a redes neurais)
- um pouco de NoSQL, MUITO (mas MUITO MESMO) SQL e engenharia de dados em geral
- Um pouco de Estatística. Sugiro pelo menos isso:
- montar e entender um modelo linear
- quartis e percentis
- margem de erro, distribuição normal
- alguns testes estatísticos, paramétricos e não-paramétricos
- Uma ferramenta decente de visualização de dados (Tableau, Looker, QlikView, PowerBI, ...)
- Noções de arquitetura serverless
Não tenha medo de não saber tudo isso, em cada tópico só precisa ter noção do que é e saber onde procurar as coisas para se especializar mais conforme a necessidade.