este é um problema que estou enfrentando no momento. Atualmente eu uso o Elevenlabs no plano de 5 USD por mes para utilizar as APIs deles. O problema é que a quantidade de créditos é muito baixa para geração massiva de conteúdo - 30 minutos de audio é muito pouco. Estou testando a COQUI TTS que é um projeto open source, mas ainda não cheguei em resultado legal igual do Eleven Labs.
Estou desenvolvendo uma ferramenta e esse também é o meu principal problema.
Esse é o principal problema de projetos que querem usar IA para criação mas não tem investimento necessário. Nós temos projetos grandes com IA e a fatura passa dos milhares de reais facilmente. A maior dificuldade é encontrar o valor correto para equilibrar as contas e pra isso a ferramenta precisa ser muito, mais muito atrativa para o cliente.
eu fiquei muito feliz que os custos com os modelos 4o estão bem mais baratos se comparados ao GPT-3.5 Turbo e os modelos estão bem mais "espertos". Mas infelizmente solução TTS de qualidade não são muitas hoje em dia
DeepSeek? Já viu ele? Me parece bem barato. Essa semana pretendo avaliar para alguns projetos que já temos e atualmente usando o 4o.
mas o GPT 4o pro meu projeto já está dentro do meu orçamento, o mais caro pra mim é a API do Eleven Labs, que o Plano IniciL é muito pouco crédito