Preparando Modelos especializados

Estatégias

- Estratégia 1: Preparação de Embeddings como base de conhecimento para Foundation Model.

- Deste modo construímos uma database vetorial que pode ser utilizada para medir Proximidade. Podemos armazenar isso em um ChromaDB ou Pinecone ou alguma outra database vetorial.

- Estratégia 2: Fine Tuning de Modelo usando provedores ou não.

- A openai por exemplo disponibiliza ferramentas para fazermos treinamento dos foundation model deles como por exemplo o gpt3.
- Isso é um método coerente para especializar um modelo já parrudo para nossos use-cases. Dito isso. Esse método exige muitos dados e é interessante utilizar técnicas de Reinforcement Learning with Human Feedback (RLHF) onde fazemos um treinamento progressivo do modelo a partir de testes humanos.

- Estratégia 3: Um Mix da 1 e 2.

Problemas

A utilização de Embeddings tem limitações.

A definição do tamanho dos chunks cuja a posiçao vetorial será definida interfere com a qualidade das pesquisas.
O algoritmo de embeddings ideal é algo que não fica claro quanto à qual é o melhor. Mas de fato interfere com a qualidade dos resultados diretamente.
A forma de entregar os resultados do Embeddings é via prompt, ou seja, é uma adição de contexto para a IA. Todavia, isso não garante que a IA vai obedecer aos embeddings, embora experimentação indique que ela vai sim.
Confiabilidade nos resultados do embedding: Os resultados vindos do embedding dependem diretamente do que foi entregue para a pesquisa, e geralmente trabalhamos com a ideia de que a pesquisa do embedding deve ser feita no contexto atual. Portanto, os resultados dependem diretamente da pergunta feita pelo usuário que pode não colaborar com o resultado desejado dependendo da forma que a pergunta é formulada. Algo do tipo "Qual é o nome disso?" Onde a informação relevante estaria na realidade na mensagem anterior e não nessa.

Problemas com Fine Tuning

Perda de capacidade de formulação: Fine-tuning tende a diminuir drásticamente a capacidade de formulação de respostas do chatgpt.
Perda de capacidade generalista. O GPT perde parte da capacidade de responder perguntas relacionadas à contextos diferentes da base de conhecimento à ele apresentada.
Aumento da alucinção. Quanto menor a base de dados mais propenso o modelo fica à identificar padrões inadequados e portanto alucinar com maior facilidade.

Daí surge minha pergunta de fato

A Openai disponibilizou a ferramenta para construção de GPTs. Essa ferramenta permite que especializemos os modelos deles para nossos objetivos pessoais.
Ao criar um modelo, ele recebe um system prompt, uma base de conhecimento e uma breve descrição (menor que 300 caracteres) de quem o bot é e o que ele faz.

A crição de um GPT é quase que imediata, então supõe-se que não há fine tuning envolvido.

Supõe-se que estão utilizando Embeddings para pesquisar na base de conhecimento disponibilizada.

Após fazer testes comparando o modelo especializado do gpt e o gpt-4 puro, o modelo especializado performou consideravelmente melhor do que o gpt4, de fato. O que implica que a base de dados, de fato, teve uma grande importância na performance.

Minha dúvida é: Como a Openai teve resultados tão melhores na construção de embeddings e na disponibilização de respostas?

Qual modelo de embeddings eles usam? Como eles separam os chunks? Como eles apresentam os resultados dos embeddings para o modelo deles? Qual foundation model eles usam gpt3.5, gpt4 ou algum modelo especializado pra isso? Quem é o time responsável pela estrutura de criação dos GPTs? Alguém tem alguma informação sobre qualquer coisa que ajude nessa jornada de entender como fazer melhores modelos de línguagem especializados?

Fica aí a oportunidade de discussão. Tamo junto, turma.

Como criar meu modelo de AI especializado baseado em algum Foundation Model?