cara, o que posso te falar é que vc vai precisar de uma automação e uma IA que identifique as digitalizações para poder transformar em texto. Para a automação vc pode usar puppeteer ou playwrigth, agora IA que identifique imagens não vou saber te dizer, mas sei que o chatGPT 4 identifica e no caso ele é pago, se vc conseguisse criar uma automação que utiliza a API do chatGPT para identificar a digitalização ou uma biblioteca do python com uma IA treinada para poder transcrever o que está na imagem em texto. Isso é o que posso ajudar.
0
1
Opa! muito obrigado pela sugestão. Pensando que sãõ docs relativamente estruturados faria bastante sentido treinar alguma coisa específica né? vou começar a pesquisar alguma coisa nesse sentido