Projeto muito interessante, uma vez pensei em realizar um projeto que precisava analisar o conteúdo das imagens, a solução mais fácil que encontrei, foi usar a api do gpt 4, aí também poderia configurar a resposta para descrever a imagem com elementos não visuais, tempetura e ofato.
Offline já complica, pois essa análise sempre irá depender do servidor, se deixar para carregar no front end, sem o usuário ter um pc da nasa, provavelmente vai fritar o circuito ao tentar fazer algo do gênero.
Uma dúvida, é um projeto de escola ou de faculdade?