Muito boa postagem, exemplificou bem alguns dos problemas dessa área. Sinto falta de discussões como essa sobre o assunto aqui no TabNews. Parece que a maioria dos conteúdos é direcionado à área de desenvolvimento web. Falando nisso, alguém teria uma indicação de lugar de divulgação/debate de assuntos relativos a esse tema?
Eu também sou dos que prefere utilizar Python. Inclusive há um crawler muito bom que já utilizei para projetos pessoais, o Scrapy. É uma ferramenta bem robusta.