Kaggle: Ajuda ou atrapalha? (Competições de Machine Learning)
Objetivo do post
O objetivo do post é entender, reunir opiniões e agrupar os benefícios e malefícios da plataforma.
O que é o Kaggle?
De acordo com a hashtag treinamentos, o Kaggle é:
"É uma plataforma para aprendizado de ciência de dados. É também uma comunidade, a maior da internet, para assuntos relacionados com Data Science.
Hoje, contém mais de 536 mil membros ativos, com novas entradas todos os dias. O Kaggle se destaca por ser uma comunidade, mas também por apresentar competições premiadas, o que profissionaliza um pouco as práticas no site.
Em geral, apresenta tutoriais, competições, rankings, cursos, dicas, fóruns, datasets e muito mais. É um grande site com uma variedade de informações para quem precisa mergulhar de cabeça nesse mundo."
Ajuda
O Kaggle ajuda muitíssimo quem está iniciando em machine learning, visto que tem datasets que facilitam a entender alguns conceitos básicos.
Como é uma competição de machine learning, todas as pessoas, inclusive têm anos na área, conseguem aprender coisas novas dos notebooks que estão no Kaggle.
Atrapalha
O Kaggle acaba sendo uma faca de dois gumes.
Como os datasets geralmente tem dados anonimizados, é possível encontrar muitos notebooks que não possuem nenhuma análise exploratória, ensinando quem é novato na área que seria necessário somente rodar os códigos para aprender e resolver problemas da vida real.
Além disso, parte dos códigos não tem explicação nenhuma como chegou até lá (principalmente quando se fala em escolha de modelo e hiper parâmetros)
E você? O que acha da plataforma?