Avaliando GPT no Enem - dicas para próximos passos?
Estou compartilhando um projeto pessoal para resolver questões do Enem usando LLMs.
De início, avaliei alguns modelos em um dataset disponibilizado neste paper, o ENEM 2022
. Os modelos utilizados na avaliação foram GPT-3.5, GPT-4, MariTalk, Falcon 7B e LLaMA 2 7B.
Os próximos passos são:
- Melhorar o formato das mensagens para os modelos.
- Melhorar prompts.
- Adicionar técnicas mais elaboradas de prompts como RAG.
Com isso, acredito conseguir melhorar a acurácia.
Além disso, pretendo criar um tutor para auxiliar estudantes a se preparar para o Enem.
O que gostariam de ver em uma aplicação como essa?
Ah, e qualquer feedback será muito bem vindo (marcar o repositório como favorito ⭐ será um excelente feedback e me motivará a continuar o projeto 🤗)
GitHub: https://github.com/viniciusarruda/llm-enem
Demo do projeto: https://llm-enem.streamlit.app/