Executando verificação de segurança...
5

Pitch: Projeto baseado nos modelos de IA Whisper e GPT da OpenAI.

Fala galera, tudo certo?

Compartilhando com vocês um projeto que criei utilizando 2 modelos de IA da OpenAI:

Whisper - Para transcrições.
GPT - Para traduções.

Basicamente você insere um aquivo de video ou audio para então receber a transcrição desses arquivo. Também adicionei a possibilidade de traduzir essa transcrição, e também exportar-las para PDF.

Repositório: https://github.com/marcosaurelioo/AudioScript
Website: https://audioscript.aurelian.dev

Nas imagens abaixo usei um shorts do deschamps como exemplo.


Carregando publicação patrocinada...
4

Impressionante que ele conseguiu misturar perfeitamente termos em inglês de um audio primariamente em português.

Você não fez nenhum ajuste no texto? Ele saiu assim mesmo?

2
1

Muito legal o projeto! Conhecia já a Whisper mas nunca a vi sendo utilizada, vou dar uma estudada na sua implementação no github. Parabéns pela iniciativa.

Creio que seria legal também adicionar alguns error handling, pois tentei subir arquivo no formato mkv ali e o site não me retornou nenhuma mensagem de erro na tela. Eu descobri que ele não suporta MKV pois tinha um console.log no navegador com a resposta da requisição me falando isso. Ou quem sabe até transferir o arquivo para mp4 automaticamente caso não esteja no formato correto!

1