Executando verificação de segurança...
1

Pra fazer fine tuning você pode usar unsloth.ai.

Pois quero treina-lo com as docs e projetos em uma linguagem especifica, que até o momento só o claude sonet conhece essa linguagem, e além disso queria algo bem personalizado e com propriedade sobre a linguagem.

Treinar um modelo é uma tarefa cara e exige muitas horas e expertise.
Existe uma diferença no termo "treinar" e "ajustar" (Fine Tuning)!

Fine Tuning

Descartando a possibilidade de treino para nós meros mortais, vamos para o fine tuning.

Quando você treina um modelo, vc cria o que chamamos de "weights" (pesos), então estes pesos vão guiar o modelo treinado a escolher um próximo token, dito isso, o processo de fine tuning é ajustar estes "pesos" para que o próximo token venha conforme seu estilo.

Baseado no seu input, fine tuning não vai ensinar novos dados ao modelo, ele vai ajustar o peso para o modelo responder conforme sua necessidade, vou dar um exemplo.

Você pode fazer fine tuning para seu modelo sempre responder com emojis, e então ele vai aprender que depois de certas expressões ou no lugar de certa expressões deveria usar emojis, e vc vai especializá-lo nisso.

Retrieval-Augmented Generation (RAG)

Esta é a técnica recomendada para "adicionar" novas informações ao modelo.
Dito isso é melhor você estudar como implementar um RaG para poder então plugar sua documentação e dar poder ao seu sistema de consultá-la.

Este cara é um dos fundadores do Ollama e ele tem um curso totalmente grátis sobre esses temas, então recomendo assistir.

Faz um vídeo ou um tuto por aqui de como treinar? please!

https://www.youtube.com/watch?v=1XCEZW_Twr0

Carregando publicação patrocinada...