Obrigada pelo comentário, GTEK!
Eu tentei reunir nesse texto alguns conceitos mais gerais e no fim citei algumas profissões correlatas; e essas correlações vêm de forma que o termo Ciência de Dados é um termo "guarda-chuva". Até onde eu sei, está correto dizer que Ciência de Dados usa de metodologias científicas, passando pelos seguintes estágios:
- Perguntas: Observar e questionar
- Pesquisa: Identificar comportamentos
- Hipótese: Analisar os dados em busca de respostas
- Teste de hipóteses: Criar experimentos para validar/checar as hipóteses
- Conclusão: Analisar os resultados (que também podem e devem ser questionados)
- Publicação: Se e somente se a conclusão estiver correta, se refere à emissão de relatórios, colocar o modelo (machine learning) em produção etc.
Com isso, eu diria que todos podem acabar passando por alguns desses estágios. O que acontece é que alguns se distanciam mais do que outros, como é o caso da Engenharia de Dados - por exemplo. De forma prática, perceba a diferença entre Análise e Engenharia:
-
Engenheiro(a) de dados: Basicamente responsável por extrair, limpar e integrar dados - compilando e instalando sistemas de banco de dados. (VYAS, 2016)
-
Analista de dados: Basicamente usa ferramentas estatísticas para interpretar bases de dados, prestando atenção à padrões e tendências que poderiam ter valor em diagnósticos e/ou em análises preditivas. (EASTWOOD, 2019)