Executando verificação de segurança...
1

Para responder a sua pergunta se você der skip tem como sim você fazer a tarefa depois, é só voltar para a página inicial e tentar começar as tarefas que ele te der denovo que uma hora você cai com a que skipou denovo, até onde eu sei. Ah, e também se tiver interessado vem falar com o pessoal brasileiro lá no servidor do discord deles.


Acho que não expliquei tão bem no post original. Vou fazer uma explicação por cima de tudo para você e as outras pessoas terem uma ideia melhor deste comentário.

Como replicar o ChatGPT

Primeiro é treinado um modelo gigante (eles estão usando modelos já treinados) com um GPT, um LLaMA e outra coisas. Esse tipo de modelo é treinado de forma que ele simplesmente prevê em questão de probabilidade de qual seria a melhor próxima palavra de um texto, então ele não é capaz de conversar com uma pessoa em forma de chat, o que ele faz é completar o texto de forma coerente.

Para conseguir uma IA que converse é necessário muitos exemplos de "árvores de conversas" que são simplesmente conversas. O pessoal da OpenAI treinou o ChatGPT usando cerca de 50 mil conversas que eles conseguiram pagando para pessoas escreverem conversas e irem ranquiando, o objetivo do OpenAssistant é isso mas de uma forma descentralizada e que acabe resultando em algo 100% aberto para todo mundo, tanto o dataset quanto o modelo treinado.

Como funciona o dataset e por que tem tentas opções no site deles

Para montar o dataset eles separaram acho que um todo sete tarefas no site deles, que são:

  • Criar prompts iniciais
  • Responder como assistente
  • Responder como usuário
  • Ordernar respostas do assistente (para que as melhores tenham melhor pontuação)
  • Classificar prompts inicias
  • Classificar resposta do assistente
  • Classificar resposta do usuário

O fluxo de cada mensagem na conversa

  1. É escrita uma prompt inicial
  2. Ela é classificada para ver se é boa ou não
  3. Alguém escreve uma resposta como assistente para prompt inicial
  4. A resposta do assistente é classificada
  5. As melhores respostas do assistente são escolhidas
  6. Alguém responde como usuário
  7. A resposta como usuário é classificada
  8. Repete de 3-8
Carregando publicação patrocinada...