Sim, por agora que ele está na versão 0.0.2-alpha5 ele ainda não consegue res... · gabrielmfern

Respondendo a "perguntei a ele, quem inventou o avião ele me r..." dentro da publicação Open Assistant: Contribua para o desenvolvimento de um modelo aberto de conversação com IA

gabrielmfern

2 anos atrás

Sim, por agora que ele está na versão 0.0.2-alpha5 ele ainda não consegue responder muitas perguntas. É exatamente por isso que eu decidi pedir ajuda a todo mundo que puder, por agora ele só tem cerca de 175 árvores de conversas em português que foram aprovadas nos dados de treinamento.

Comparar com o ChatGPT ainda não é uma luta justa porque ele não só tem um tamanho que muito provavelmente é de $\frac{1}{3}$ à $\frac{1}{4}$ do do ChatGPT como também ele foi treinado em cerca de $\frac{1}{5}$ do que o ChatGPT foi originalmente, (que até esse ponto com certeza já é bem mais), sem contar que o ChatGPT foi lançado desde novembro do ano passado e quando foi lançada já havia usado 50 mil árvores de conversas.

Mas realmente, sim, ele dá respostas muito ruins e geralmente mete a louca em português.

Tentando fazer a mesma prompt com ele denovo, e pedindo para ele consertar:

**USUÁRIO**: Quem inventou o avião?

**OA**: O mais antigo registo de um aparelho voador data do século XVII, 
em uma gravura de Johannes Kepler.
Mas só no século XIX que surgiram os primeiros protótipos funcionais.

**USUÁRIO**: isso é veridico?

**OA**: Ao meu conhecimento sim! Os registros históricos fazem referência a 
esse tipo de tecnologia desde tempos imemoriais, contudo era a partir dos 
engenheiros Orville Wright e Wilbur Wright nos idos 1903 que surgiu como 
tecnologia praticamente utilizável pelas frotas militares da época

O que mostra que agora ele respondeu corretamente.

viniciotricolor

2 anos atrás

Entendi. O teste que fiz foi pelo celular, mas agora vou testar mais pelo computador. Testei e ele já está dizendo que foi Santos Dumont. Existe uma maneira de eu criar e responder minhas próprias perguntas? Quanto ao lance de ajudar, não entendi muito bem. Se eu der skip, nunca mais vou poder ajudar aquela pesquisa?

gabrielmfern

Autor

2 anos atrás

Para responder a sua pergunta se você der skip tem como sim você fazer a tarefa depois, é só voltar para a página inicial e tentar começar as tarefas que ele te der denovo que uma hora você cai com a que skipou denovo, até onde eu sei. Ah, e também se tiver interessado vem falar com o pessoal brasileiro lá no servidor do discord deles.

Acho que não expliquei tão bem no post original. Vou fazer uma explicação por cima de tudo para você e as outras pessoas terem uma ideia melhor deste comentário.

Como replicar o ChatGPT

Primeiro é treinado um modelo gigante (eles estão usando modelos já treinados) com um GPT, um LLaMA e outra coisas. Esse tipo de modelo é treinado de forma que ele simplesmente prevê em questão de probabilidade de qual seria a melhor próxima palavra de um texto, então ele não é capaz de conversar com uma pessoa em forma de chat, o que ele faz é completar o texto de forma coerente.

Para conseguir uma IA que converse é necessário muitos exemplos de "árvores de conversas" que são simplesmente conversas. O pessoal da OpenAI treinou o ChatGPT usando cerca de 50 mil conversas que eles conseguiram pagando para pessoas escreverem conversas e irem ranquiando, o objetivo do OpenAssistant é isso mas de uma forma descentralizada e que acabe resultando em algo 100% aberto para todo mundo, tanto o dataset quanto o modelo treinado.

Como funciona o dataset e por que tem tentas opções no site deles

Para montar o dataset eles separaram acho que um todo sete tarefas no site deles, que são:

Criar prompts iniciais
Responder como assistente
Responder como usuário
Ordernar respostas do assistente (para que as melhores tenham melhor pontuação)
Classificar prompts inicias
Classificar resposta do assistente
Classificar resposta do usuário

O fluxo de cada mensagem na conversa

É escrita uma prompt inicial
Ela é classificada para ver se é boa ou não
Alguém escreve uma resposta como assistente para prompt inicial
A resposta do assistente é classificada
As melhores respostas do assistente são escolhidas
Alguém responde como usuário
A resposta como usuário é classificada
Repete de 3-8