Para responder a sua pergunta se você der skip tem como sim você fazer a tare... · gabrielmfern

Para responder a sua pergunta se você der skip tem como sim você fazer a tarefa depois, é só voltar para a página inicial e tentar começar as tarefas que ele te der denovo que uma hora você cai com a que skipou denovo, até onde eu sei. Ah, e também se tiver interessado vem falar com o pessoal brasileiro lá no servidor do discord deles.

Acho que não expliquei tão bem no post original. Vou fazer uma explicação por cima de tudo para você e as outras pessoas terem uma ideia melhor deste comentário.

Como replicar o ChatGPT

Primeiro é treinado um modelo gigante (eles estão usando modelos já treinados) com um GPT, um LLaMA e outra coisas. Esse tipo de modelo é treinado de forma que ele simplesmente prevê em questão de probabilidade de qual seria a melhor próxima palavra de um texto, então ele não é capaz de conversar com uma pessoa em forma de chat, o que ele faz é completar o texto de forma coerente.

Para conseguir uma IA que converse é necessário muitos exemplos de "árvores de conversas" que são simplesmente conversas. O pessoal da OpenAI treinou o ChatGPT usando cerca de 50 mil conversas que eles conseguiram pagando para pessoas escreverem conversas e irem ranquiando, o objetivo do OpenAssistant é isso mas de uma forma descentralizada e que acabe resultando em algo 100% aberto para todo mundo, tanto o dataset quanto o modelo treinado.

Como funciona o dataset e por que tem tentas opções no site deles

Para montar o dataset eles separaram acho que um todo sete tarefas no site deles, que são:

Criar prompts iniciais
Responder como assistente
Responder como usuário
Ordernar respostas do assistente (para que as melhores tenham melhor pontuação)
Classificar prompts inicias
Classificar resposta do assistente
Classificar resposta do usuário

O fluxo de cada mensagem na conversa

É escrita uma prompt inicial
Ela é classificada para ver se é boa ou não
Alguém escreve uma resposta como assistente para prompt inicial
A resposta do assistente é classificada
As melhores respostas do assistente são escolhidas
Alguém responde como usuário
A resposta como usuário é classificada
Repete de 3-8