Executando verificação de segurança...
4

Afinal, o que é Ciência de Dados?

Um texto descomplicador de conceito, por Naomi Lago



   Olá, eu me chamo Naomi e trabalho como Analista de Dados na Nestlé. Sou entusiasta e estudante de tecnologia desde 2018 e, quando nos interessamos por tecnologia, sabemos que existem inúmeras áreas de atuação e - dentre elas -, a área de Ciência de Dados. É sobre essa área que irei falar hoje.

   Quando falamos sobre Ciência de Dados, ou *Data Science*, estamos descrevendo o processo de transformação de dados em conhecimento (LOUKIDES, 2016). Isso nos descreve que apenas usar dados (coletar, armazenar e publicar) não é suficiente, mas sim agregar valor a eles, permitindo novas formas de uso.


Data Scientist: pessoa que é melhor em estatística que quaisquer engenheiros de software e melhor em engenharia de software que quaisquer estatístico.

Josh Wills


   Bem, segundo Wills, engenharia de software e estatística estão de alguma forma envolvidas nessa área. Isso porque os valores agregados a partir das análises têm como base conceitos estatísticos que são aplicados em códigos - seja através de processamento, visualização ou modelagem dos dados. Dessa forma, podemos dizer que a Ciência de Dados é composta por algumas etapas:



NOTA-SE
Nem sempre todas as etapas são concluídas. Em uma análise mais focada na visualização dos dados já existentes, por exemplo, a modelagem se faz indiferente.

   Ok. Agora que entendemos o que é Ciência de Dados, vale a pena pesquisar sobre algumas profissões correlatas - como:

  • Engenheiro(a) de Dados
  • Analista de Dados
  • Cientista de Dados
  • Gerente de Dados





   Obrigada por ter lido até aqui, até a próxima ⭐

   2022, Naomi Lago

Carregando publicação patrocinada...
4

Obrigado por ter postado Naomi!!

Parece que está falando da área de dados e não efetivamente de Ciência de dados.

Uma dúvida, ciência de dados, pelo que eu entendo, aplica a metodologia científica dentro da empresa, aplicando artigos e experimentos, engenharia e análise não realiza essa metodologia, certo?

3

Obrigada pelo comentário, GTEK!

Eu tentei reunir nesse texto alguns conceitos mais gerais e no fim citei algumas profissões correlatas; e essas correlações vêm de forma que o termo Ciência de Dados é um termo "guarda-chuva". Até onde eu sei, está correto dizer que Ciência de Dados usa de metodologias científicas, passando pelos seguintes estágios:

  • Perguntas: Observar e questionar
  • Pesquisa: Identificar comportamentos
  • Hipótese: Analisar os dados em busca de respostas
  • Teste de hipóteses: Criar experimentos para validar/checar as hipóteses
  • Conclusão: Analisar os resultados (que também podem e devem ser questionados)
  • Publicação: Se e somente se a conclusão estiver correta, se refere à emissão de relatórios, colocar o modelo (machine learning) em produção etc.

Com isso, eu diria que todos podem acabar passando por alguns desses estágios. O que acontece é que alguns se distanciam mais do que outros, como é o caso da Engenharia de Dados - por exemplo. De forma prática, perceba a diferença entre Análise e Engenharia:

  • Engenheiro(a) de dados: Basicamente responsável por extrair, limpar e integrar dados - compilando e instalando sistemas de banco de dados. (VYAS, 2016)

  • Analista de dados: Basicamente usa ferramentas estatísticas para interpretar bases de dados, prestando atenção à padrões e tendências que poderiam ter valor em diagnósticos e/ou em análises preditivas. (EASTWOOD, 2019)

1
3

Ótimas explicações @naomilago. Foram bem esclarecedoras para mim. Sou iniciante em ciência de dados, apesar de estudar estatística e programação há bastante tempo.

Eu sou formado em física e estou agora perto de concluir o mestrado, também em física. Sempre trabalhei com física computacional e física estatística e agora estou migrando para ciência de dados. Pretendo iniciar no mercado como analista de dados.

Achei bem interessante essa frase de Josh Wills, ela resume bem o que é um cientista de dados.

Sucesso na sua carreira.

Meu github: https://github.com/felipe-science

1
2

Obrigado pelo post, naomilago. Enriquecedor!

Esta área está muito aquecida no mercado. Seria de muita relevância conhecer a sua visão sobre alguns detalhes de cada etapa que citou, do modo como acontecem na vida real de quem trabalha com isso, e não como nos cursos e vídeos que encontramos pela internet. Vi que alguns aqui do tabnews têm grande interesse em ciência de dados de uma maneira direcionada a quem está começando (Por exemplo aqui), e isso ajudaria muito.

1

Olá, @bertini, tudo certo por aí?


     Primeiramente eu gostaria de me desculpar pela demora em responder, eu fiquei afastada das minhas atividades nesses últimos 60 dias.

     Eu adoraria compartilhar meus processos com quem tiver interesse em saber mais sobre. Essa área está em constante mudança e eu tenho cada vez mais encontrado minha "sub-área" favorita, que é NLP. Eu tenho planos de fomentar algumas discussões sobre esse tema enquanto eu vou estudando e me aprofundando nesse assunto riquíssimo que envolve Machine Learning (ML) e Inteligência Artificial (IA).

     Eu posso auxiliar com a construção, condução e análise de projetos open-source em todos e qualquer nível. Quem tiver interesse, inclusive, eu me coloco à disposição para colocar essas ideias em prática.

     Paralelo à isso, eu deixo um link de uma pesquisa que estou iniciando e, contribuições são bem-vindas. Vocês podem saber mais em um post que fiz no meu LinkedIn e entrar em contato através do meu e-mail [email protected] para agendarmos um bate-papo.

     Através desse mesmo e-mail, podemos organizar sprints com projetos pessoais e open-source para que possamos ter projetos em portifólio! Quaisquer dúvidas e/ou sugestões, eu me coloco à disposição :)


Carinhosamente,
Naomi Lago

2

Muito legal esse conteudo @naomilago,cotinue postando mais sobre. Bem interessante e esclarecedor.Vou comceçar estudar estatística esse mês de dezembro no curso e programação venho me esforçando bastante tempo para aprender e apesar de ter varias areas de atuação essa parte de dados e bem interresante, ja venho estudando um pouco de banco de dados e falta ver phyton, apesar de ser uma area bacana acho muito legal a parte do front and e ai entra o dilema da tecnologia e muito area de atuação e o cara tem que escoher uma pra focar e ficar bom.

2

Olá, @talilotarlison, tudo bem?


     Primeiramente eu gostaria de me desculpar pela demora em responder, eu fiquei afastada das minhas atividades nesses últimos 60 dias.

     Tenho a intenção de continuar postando sim e fico muito feliz com comentários como o seu que me motivam a compartilar os meus estudos e também incentivar quem se interessa pela área.

     Te desejo uma boa tragetória com muitas conquistas, assim como todas as outras áreas de conhecimento essa necessita de bastante disciplina e estudos - mas que no final tudo é recompensado.

"E quando você pensar em desistir, lembre-se dos motivos que te fizeram aguentar até agora."
-- Autoria desconhecida


Carinhosamente,
Naomi Lago

2

Ótimas conteúdo @naomilago, tava sentindo falta por aqui, não consigo entender bem a diferença entre um Cientista e um analista de dados, você poderia me ajudar?
Você poderia também me indicar alguns materias para estudo e se possível falar um pouco como foi seu processo para conseguir uma vaga como analista.

1

Olá, @Geraldomendes, como vai?


     Primeiramente eu gostaria de me desculpar pela demora em responder, eu fiquei afastada das minhas atividades nesses últimos 60 dias.

     Segundo Maurício Bezerra que é Analista de Dados no Guiabolso, se define Analista de Dados "quem está mais próximo do negócio em si" (Fevereiro de 2022). Então se torna responsabilidade das pessoas analistas a compreensão do negócio, a realização de análises e a apresentação de soluções para todas as áreas da empresa. Bezerra ainda afirma que, pela conexão que analistas têm com o Business da empresa, precisam saber onde encontrar dados para gerar informações precisas para os times de negócio.

     Geralmente, a diferença entre Analistas e Cientistas de Dados se dá pelas aplicabilidades. Uma pessoa Cientista de Dados, por exemplo, vai entrar também na parte de predições. Se eu preciso criar um modelo preditivo para estimar (usando matemática, estatística e a compreensão clara da área de negócio) se um e-mail é spam - baseados em outros e-mails já classificados como spam, eu posso usar os classificadores encontrados em bibliotecas de Machine Learning (Aprendizagem de Máquina) - usando estatísticas e outras ferramentas.

     Eu recomendo, para início de carreira em dados, ter um domínio em Python - em nível intermediário ao menos. Com isso, você consegue construir seu conhecimento com práticas dos problemas do negócio e explorar mais bibliotecas. O canal do YouTube "Eduardo Mendes", ou "Dunossauro" pode auxiliar nesse processo de nivelamento da linguagem Python. Além disso, ler e aplicar técnicas das documentações oficiais (Python e suas bibliotecas) é uma ótima prática.

     Por fim, o meu processo para chegar até minha posição profissional atual foi um tanto quanto longo (visto que eu comecei a estudar tecnologia desde meus 15 anos e hoje me encontro com 19 anos). Essa história vale um novo post que tenho a intenção de publicar por aqui, então continue acompanhando que logo mais temos um post contando um pouco mais sobre mim e minha relação com a Tecnologia da Informação (TI).


Carinhosamente,
Naomi Lago

1
1

Muito bom o conteúdo Naomi, esse conceito mostra qual ampla é a atuação. Gostei do fluxo das etapas da aplicação dos fundamentos de ciência de dados. Aguardando mais postagens suas. Atenciosamente,

1

Muito bom.
Uma coisa interessante é que apesar do termo "data science" ter sido cunhado bem recentemente, a prática de data science tem décadas. Sob o nome de mineração de dados, business intelligence, marketing, inteligência competitiva... Ler sobre as ultimas três pode agregar muito ao profissional de dados.