Então, a base do projeto é toda em cima da biblioteca Langchain. Segue alguns links de como você pode criar sua base de conhecimento para o banco de dados vetorial com base em arquivos de texto ou Markdown:
- https://python.langchain.com/en/latest/use_cases/question_answering.html
- https://python.langchain.com/en/latest/modules/indexes/document_loaders/examples/markdown.html?highlight=markdown
Há várias outras alternativas para o Pinecone também. Como pode ser visto aqui https://python.langchain.com/en/latest/modules/indexes/vectorstores.html
Eu acho o Langchain uma biblioteca fantástica e pelo que tenho visto ela está bem atualizada e recebe contribuição diariámente de muitos desenvoldores.
Veja outros links interessantes:
- https://python.langchain.com/en/latest/modules/agents/agent_executors/examples/chatgpt_clone.html
- https://python.langchain.com/en/latest/modules/memory/getting_started.html
- https://python.langchain.com/en/latest/modules/chains/index_examples/qa_with_sources.html
- https://python.langchain.com/en/latest/modules/chains/index_examples/summarize.html
- https://python.langchain.com/en/latest/modules/agents/tools/examples/bash.html
- https://python.langchain.com/en/latest/modules/agents/agents/examples/mrkl.html