Executando verificação de segurança...
8

OpenAI anuncia o Whisper: uma nova rede neural open source para reconhecimento de fala

A OpenAI anunciou hoje o Whisper, uma nova rede neural disponível de forma gratuita e open source para reconhecimento de fala com uma precisão inédita.

Segundo a descrição no anúncio oficial:

Treinamos e estamos abrindo o código de uma rede neural chamada Whisper que atinge a robustez e precisão nível humano no reconhecimento de fala em inglês.

Whisper

Sugiro entrar no aúncio oficial e clicar para escutar o primeiro audio de exemplo junto com a transcrição. É um absurdo de difícil entender o que a pessoa está falando, mas o Whisper conseguiu transcrever com altíssima precisão.

Carregando publicação patrocinada...
4

Eles atualizaram o readme do repositório um pouco depois do primeiro commit, e colocaram uma comparação da taxa de erro de palavras (WER - word error rate) de acordo com o idioma. Achei interessante que o português está entre as melhores:

Os idiomas com menos erros são Espanhol com 3.5, Italiano 4.2, Inglês 4.5 e Português 4.8