Meu Próprio Chatbot
Olá pessoal do tab news, recentemente estive estudando ML e Algoritmos probababilisticos. Eu implementei um chatbot usando modelo pré treinado refinado e gostaria que vocês me dessem um feedback seja melhoria de código, ideias, refact etc.
Repositório: https://github.com/0x41337/my-own-chatbot
Demostração Online: https://0x41337-my-own-chatbot.hf.space
O modelo tem um limite de 500 tokens
então se o Contexto
for maior que o limite do tokens o modelo não vai funcionar.
Explicando sobre Context
- Context em sistemas de Q&A
No contexto do aprendizado de máquina (ML), "contexto" refere-se à informação ou ao ambiente que envolve um determinado evento ou situação. O contexto pode ser fundamental para entender e interpretar corretamente os dados e fazer previsões ou tomar decisões precisas.
Explicando sobre Tokens
Os tokens são unidades de texto que podem variar de palavras inteiras a caracteres individuais, dependendo do contexto. Em relação ao processamento de linguagem natural (NLP) e ao uso de modelos de linguagem, os tokens são geralmente palavras ou subpalavras. Eles são importantes porque afetam a forma como os dados são processados e representados em um modelo de ML.
Explicando sobre Feixes de Probabilidades
Feixes de probabilidade, também conhecidos como "beam search" em inglês, são uma técnica comumente usada em modelos de linguagem, como o GPT (Generative Pre-trained Transformer), para gerar sequências de texto coerentes e de alta qualidade. Essa abordagem busca gerar uma lista de hipóteses ou sequências candidatas, avaliando sua probabilidade em relação ao contexto.