Olá Ericky, tudo bom?
Boas indagações que você fez ai, vou tentar responder todas.
pela descrição, eu imaginei que fosse uma ferramenta de "speech to text" ou algo parecido, mas depois de testar, parece mais uma ferramenta de identificação de contexto do conteúdo do áudio. é esse o intuito?
O objetivo principal do bot é gerar transcrições resumidas das mensagens de voz do WhatsApp para que os usuários possam economizar tempo e se manter organizados, oferecendo uma visão geral do conteúdo de suas mensagens de voz em um formato mais facilmente acessível. Embora o bot utilize tecnologia avançada de reconhecimento de fala para transcrever o áudio, o objetivo principal é fornecer uma visão geral do conteúdo, em vez de uma transcrição completa.
não seria mais interessante enviar também a transcrição do áudio?
Quando consideramos a possibilidade de enviar transcrições completas, encontramos alguns obstáculos significativos. Por exemplo, as mensagens enviadas via Twilio têm um limite de 1600 caracteres. Quando a transcrição excede esse limite, precisamos dividi-la em pedaços menores. Embora tenhamos dividido a transcrição em pedaços de 1600 caracteres cada, isso criou outro obstáculo: as mensagens enviadas sequencialmente não chegavam na ordem correta na conversa do WhatsApp, o que causou problemas na entrega. Como essa não era a nossa principal prioridade do projeto, decidimos adiar essa funcionalidade para uma possível melhoria futura.
também percebi que o sistema de créditos é um pouco "injusto". mandei um áudio de 3s e foi consumido um crédito. não seria mais interessante criar alguma métrica mais fracionada?
Para solucionar esse problema, estamos considerando a adoção de um limite mínimo de tempo de áudio, permitindo que os usuários enviem apenas mensagens de voz com duração superior a um minuto. Essa medida evitará que os usuários sejam cobrados indevidamente por mensagens muito curtas.
Por fim, obrigado pelo seu interesse em nosso projeto e por suas sugestões construtivas. Estamos trabalhando continuamente para melhorar a experiência do usuário e apreciamos qualquer feedback que possa nos ajudar a alcançar esse objetivo.