Vocês não pensaram em criar um RAG ao invés de usar o FineTunning?
Pessoalmente eu prefiro muito mais usar um RAG com verificação de similaridades e captura do contexto por base nessa similaridade, dessa forma o custo é menor e consegue gerar reposta com extrema precisão.
Observação: no dia 25 de janeiro foi lançado novas versões de Embedding que estão mais poderosos e muito mais baratos.