Meus 2 cents:
Da uma pesquisada sobre treinamento de IA e 'vector database' e 'embeddings' (p.ex. pinecone, Chroma, Milvus, Qdrant, Weaviate, etc - procure por 'open source vector database ia training')
Basicamente: voce pega os dados dos usuarios, 'joga' no banco de dados de vetor e quando um usuario fizer a pergunta, voce primeiro processa neste banco de dados (que pode ser local, sem custo) e entao com o resultado passa a pergunta e o resultado para a IA formatar e trabalhar.
https://brains.dev/2024/token-e-embedding-conceitos-da-ia-e-llms/
https://triggo.ai/blog/vector-database-e-sua-relacao-com-a-ia/