Pitch: Meu SaaS de Web Scraping (Xcrap Cloud)
Olá, pessoas! Como vão? Hoje tenho o orgulho de finalmente apresentar algo que me gastou um bom tempo e que na verdade demandou mais do que a criação de um SaaS, mas também a criação de uma biblioteca (ou talvez um framework) chamado Xcrap. Farei a documentação dele em breve e divulgarei a assim que possível destacando algumas de suas pricipais funcionalidades.
Bom, aqui estamos para falar um sobre a plataforma:
Clientes
Essencialmente um cliente HTTP, você pode configurar algumas coisas como User Agents, Proxies, CORS Proxies (eu incluí a opção de poder adicionar eles porque tu consegue "balancear" o IP que está acessando o site). Além disso você pode definir o tipo do cliente também, mas atualmente temos apenas o Axios porque não consegui rodar de jeito nenhum uma instância de Puppeteer na Vercel (planejo migrar para a AWS se eu perceber que o negócio tem futuro).
Plugins de Cliente
Plugins de Cliente serveriam apenas para o Puppeteer, seriam aqueles Stealth, Amazon Captcha, Adblocker. Servem para deixar o navegador mais furtivo (evitando armadilhas para bots), resolver captchas e bloquear anúncios.
Ações de Cliente
Ações de Cliente podem ser usadas para ajudar na furtiviade do navegador também, mas em breve quero adicionar ações que você possa definir parâmetros, como por exemplo uma ação "Click On" que eu passo um seletor e toda vez que o cliente for executado ele fará isso.
Scrapers
Scrapers são a junção do Cliente, os Plugins de Cliente , Ações de Cliente a URL que será acessada (talvez eu mude no futuro e deixe que o usuário informe a URL no ato da execução).
Scrapers não retém os dados, você pode executá-los apenas, a responsabilidade em guardar esses dados fica com você, tu pode fazer isso de várias formas, como arquivo JSON, salvar em um banco de dados, arquivo CSV... envim, as possibilidades são muitas...
Acesso à API
Algumas funcionalidades ainda não estão disponíveis via interface, essencialmente funcionalidade de atualizar os objetos da plataforma, mas isso já está disponível via API, tu pode gerar sua chave de API entrando na aba de conta e fazer isso diretamente, sei muito bem que não é a melhor forma de disponibilizar isso para o usuário, mas foi uma forma de diminuir a complexidade das coisas (já que eu tava quebrando a cabeça com esses formulários kkkkkkk)
Fonte: https://xcrap.cloud