Executando verificação de segurança...
1
rakbo
1 min de leitura ·

[Ajuda] Extração de dados - RG/CPF/Comprovante de residência/Etc

Fala pessoal.

Estou buscando alguma forma de agilizar o cadastramento de clientes e agilizar a vida.

Queria encontrar uma forma de digitalizar os principais documentos pessoais e já extrair deles as informações principais para cadastro no nosso sistema.

Alguém já trabalhou com algum recurso ou até mesmo produto que faça isso bem? Open source é sempre muito melhor, mas posso tentar aprovar algum sistema pago também.

Qualquer ajuda é bem vinda!

1

busque uma solução de Know Your Customer, como por exemplo o idwall. ou então extraia usando AWS Textextract ou alguma outra solução de OCR open source como por ex EasyOCR

1

Dei uma olhada por alto na idwall é parece atender bem essa demanda! Vou tentar primeiro um caminho de OCR+Regex e emparalelo tento entender se o custo seria viável. Obrigado pelas sugestões!

1

avalia tb se faz sentido o risco da sua empresa captar, armazenar e tratar esses dados. as vezes pode ser mais interessante uma empresa terceira fazer essa checagem

0

cara, o que posso te falar é que vc vai precisar de uma automação e uma IA que identifique as digitalizações para poder transformar em texto. Para a automação vc pode usar puppeteer ou playwrigth, agora IA que identifique imagens não vou saber te dizer, mas sei que o chatGPT 4 identifica e no caso ele é pago, se vc conseguisse criar uma automação que utiliza a API do chatGPT para identificar a digitalização ou uma biblioteca do python com uma IA treinada para poder transcrever o que está na imagem em texto. Isso é o que posso ajudar.

1

Opa! muito obrigado pela sugestão. Pensando que sãõ docs relativamente estruturados faria bastante sentido treinar alguma coisa específica né? vou começar a pesquisar alguma coisa nesse sentido