Executando verificação de segurança...
1

Sim, por agora que ele está na versão 0.0.2-alpha5 ele ainda não consegue responder muitas perguntas. É exatamente por isso que eu decidi pedir ajuda a todo mundo que puder, por agora ele só tem cerca de 175 árvores de conversas em português que foram aprovadas nos dados de treinamento.

Comparar com o ChatGPT ainda não é uma luta justa porque ele não só tem um tamanho que muito provavelmente é de \frac{1}{3} à \frac{1}{4} do do ChatGPT como também ele foi treinado em cerca de \frac{1}{5} do que o ChatGPT foi originalmente, (que até esse ponto com certeza já é bem mais), sem contar que o ChatGPT foi lançado desde novembro do ano passado e quando foi lançada já havia usado 50 mil árvores de conversas.

Mas realmente, sim, ele dá respostas muito ruins e geralmente mete a louca em português.

Tentando fazer a mesma prompt com ele denovo, e pedindo para ele consertar:

**USUÁRIO**: Quem inventou o avião?

**OA**: O mais antigo registo de um aparelho voador data do século XVII, 
em uma gravura de Johannes Kepler.
Mas só no século XIX que surgiram os primeiros protótipos funcionais.

**USUÁRIO**: isso é veridico?

**OA**: Ao meu conhecimento sim! Os registros históricos fazem referência a 
esse tipo de tecnologia desde tempos imemoriais, contudo era a partir dos 
engenheiros Orville Wright e Wilbur Wright nos idos 1903 que surgiu como 
tecnologia praticamente utilizável pelas frotas militares da época

O que mostra que agora ele respondeu corretamente.

Carregando publicação patrocinada...
1

Entendi. O teste que fiz foi pelo celular, mas agora vou testar mais pelo computador. Testei e ele já está dizendo que foi Santos Dumont. Existe uma maneira de eu criar e responder minhas próprias perguntas? Quanto ao lance de ajudar, não entendi muito bem. Se eu der skip, nunca mais vou poder ajudar aquela pesquisa?

1

Para responder a sua pergunta se você der skip tem como sim você fazer a tarefa depois, é só voltar para a página inicial e tentar começar as tarefas que ele te der denovo que uma hora você cai com a que skipou denovo, até onde eu sei. Ah, e também se tiver interessado vem falar com o pessoal brasileiro lá no servidor do discord deles.


Acho que não expliquei tão bem no post original. Vou fazer uma explicação por cima de tudo para você e as outras pessoas terem uma ideia melhor deste comentário.

Como replicar o ChatGPT

Primeiro é treinado um modelo gigante (eles estão usando modelos já treinados) com um GPT, um LLaMA e outra coisas. Esse tipo de modelo é treinado de forma que ele simplesmente prevê em questão de probabilidade de qual seria a melhor próxima palavra de um texto, então ele não é capaz de conversar com uma pessoa em forma de chat, o que ele faz é completar o texto de forma coerente.

Para conseguir uma IA que converse é necessário muitos exemplos de "árvores de conversas" que são simplesmente conversas. O pessoal da OpenAI treinou o ChatGPT usando cerca de 50 mil conversas que eles conseguiram pagando para pessoas escreverem conversas e irem ranquiando, o objetivo do OpenAssistant é isso mas de uma forma descentralizada e que acabe resultando em algo 100% aberto para todo mundo, tanto o dataset quanto o modelo treinado.

Como funciona o dataset e por que tem tentas opções no site deles

Para montar o dataset eles separaram acho que um todo sete tarefas no site deles, que são:

  • Criar prompts iniciais
  • Responder como assistente
  • Responder como usuário
  • Ordernar respostas do assistente (para que as melhores tenham melhor pontuação)
  • Classificar prompts inicias
  • Classificar resposta do assistente
  • Classificar resposta do usuário

O fluxo de cada mensagem na conversa

  1. É escrita uma prompt inicial
  2. Ela é classificada para ver se é boa ou não
  3. Alguém escreve uma resposta como assistente para prompt inicial
  4. A resposta do assistente é classificada
  5. As melhores respostas do assistente são escolhidas
  6. Alguém responde como usuário
  7. A resposta como usuário é classificada
  8. Repete de 3-8