Para responder a sua pergunta se você der skip tem como sim você fazer a tarefa depois, é só voltar para a página inicial e tentar começar as tarefas que ele te der denovo que uma hora você cai com a que skipou denovo, até onde eu sei. Ah, e também se tiver interessado vem falar com o pessoal brasileiro lá no servidor do discord deles.
Acho que não expliquei tão bem no post original. Vou fazer uma explicação por cima de tudo para você e as outras pessoas terem uma ideia melhor deste comentário.
Como replicar o ChatGPT
Primeiro é treinado um modelo gigante (eles estão usando modelos já treinados) com um GPT, um LLaMA e outra coisas. Esse tipo de modelo é treinado de forma que ele simplesmente prevê em questão de probabilidade de qual seria a melhor próxima palavra de um texto, então ele não é capaz de conversar com uma pessoa em forma de chat, o que ele faz é completar o texto de forma coerente.
Para conseguir uma IA que converse é necessário muitos exemplos de "árvores de conversas" que são simplesmente conversas. O pessoal da OpenAI treinou o ChatGPT usando cerca de 50 mil conversas que eles conseguiram pagando para pessoas escreverem conversas e irem ranquiando, o objetivo do OpenAssistant é isso mas de uma forma descentralizada e que acabe resultando em algo 100% aberto para todo mundo, tanto o dataset quanto o modelo treinado.
Como funciona o dataset e por que tem tentas opções no site deles
Para montar o dataset eles separaram acho que um todo sete tarefas no site deles, que são:
- Criar prompts iniciais
- Responder como assistente
- Responder como usuário
- Ordernar respostas do assistente (para que as melhores tenham melhor pontuação)
- Classificar prompts inicias
- Classificar resposta do assistente
- Classificar resposta do usuário
O fluxo de cada mensagem na conversa
- É escrita uma prompt inicial
- Ela é classificada para ver se é boa ou não
- Alguém escreve uma resposta como assistente para prompt inicial
- A resposta do assistente é classificada
- As melhores respostas do assistente são escolhidas
- Alguém responde como usuário
- A resposta como usuário é classificada
- Repete de
3-8