Projeto Descrição de Imagens com IA

O projeto visa desenvolver uma aplicação utilizando inteligência artificial (IA), para descrever detalhadamente imagens, proporcionando acesso a pessoas com deficiência visual ou com dificuldade de interpretação visual. Uma aplicação desse tipo utiliza algoritmos de visão computacional e processamento de linguagem natural para identificar objetos, pessoas e interações presentes na imagem e gerar uma descrição coerente e compreensível por meio de voz.

A aplicação desenvolvida precisa ser acessível e fácil de usar, com uma interface intuitiva que permita aos usuários carregar imagens a partir de diversos dispositivos, como smartphones, tablets ou computadores. Portanto, o projeto pode ser desenvolvido como uma aplicação web, desktop ou móvel. As ferramentas, linguagens e abordagens podem ser de qualquer tipo, desde que se atinja o objetivo proposto.

Um dos principais desafios a serem enfrentados na implementação dessa aplicação é o processamento offline das imagens. Devido à complexidade dos algoritmos de visão computacional e processamento de linguagem natural, assim como à necessidade de uma quantidade significativa de recursos computacionais, o processamento das imagens pode exigir uma grande capacidade de processamento.

O objetivo final com esse projeto é proporcionar independência e inclusão às pessoas com deficiência visual, em que permite que elas tenham acesso as informações visuais de forma acessível e autônoma. Dessa forma, ao possibilitar que as pessoas com deficiência visual compreendam e interajam com o ambiente visual ao seu redor, a aplicação contribuirá significativamente para o aumento da qualidade de vida e o fortalecimento da autoconfiança.

Para o desenvolvimento da aplicação, serão utilizadas as seguintes ferramentas, materiais e bibliotecas:

Linguagem de Programação: Python, Java Script.
Framework: Flask ou Django.
Bibliotecas: OpenCV, TensorFlow, Keras.
Outras linguagens: HTML e CSS.
Ferramenta de prototipação: Figma.
Obs: A partir do desenvolvimento do projeto, poderá haver alterações de linguagens e bibliotecas. Se houverem alterações, será informado.

Queria saber aqui da comunidade se teria alguma tecnoligia mas simples para implementar e também alguma informação sobre como eu poderia projetar isso offline por que isso é meu maior desafio, se alguém tiver alguma dica ficarei grato.