Com o avanço dos modelos de IA generativa, a engenharia de prompt tornou-se desnecessária?
Dado o contexto atual, tendemos a responder afirmativamente a pergunta apresentada no título. Temos modelos de centenas de bilhões de parâmetros ao nosso dispor, com capacidade de raciocínio e, até certo ponto, disponibilizados de maneira gratuita.
Porém, devemos entender a diferença entre o uso de uma IA generativa por um CPF, em relação ao uso desta mesma IA generativa por um CNPJ.
Como sabemos, o ambiente corporativo lida com tradeoffs, isto é, os gestores (constantemente) tentam encaixar a frase "... mas em compensação...". Por exemplo, o modelo llama de 1 bilhão de parâmetros não é tão assertivo quanto o modelo de 400 bilhões de parâmetros, mas em compensação, soluções que utilizam o modelo de 1 bi custam muito menos e podem, facilmente, ser implementadas de maneira local.
Aí entra a mágica da Engenharia de prompt. A engenharia de prompt leva em consideração a natureza probabilística do LLM. Se a sequência de tokens (input) que é produzida a partir do seu prompt for bem projetada, a probabilidade do seu modelo errar diminui.
A vantagem dessa abordagem é o baixo custo, uma vez que você não precisa fazer o fine-tuning do seu modelo, nem apresentar contexto adicional (como soluções RAG).
Uma maneira de melhorar o resultado de seus prompts é através de uma técnica chamada Chain-of-Thoughts (CoT). Nesta técnica, você estimula o raciocínio do modelo através de cadeias de pensamento. Veja aqui, a imagem ilustrando este processo, como podemos ver, a resposta correta (9 maçãs) só é obtida quando utilizamos a cadeia de pensamento.
Vemos assim que a engenharia de prompt continua sendo uma habilidade importante. E quanto mais competente o engenheiro de prompt, menor o custo de implementação e maior a eficácia de soluções que dependem de modelos de IA generativa.
Fontes consultadas
"6 Common LLM Customization Strategies Briefly Explained". Publicado no Towards Data Science.
"Chain-of-Thought Prompting Elicits Reasoning in Large Language Models". Publicado no Arxiv.
#CadeiaDePensamentos #EngenhariaDePrompt #LLM