Yandex libera maior modelo de linguagem natural disponível em código aberto
Com 100 bilhões de parâmetros, o “YaLM 100B” é uma rede neural similar ao GPT para geração e processamento de texto – o sistema, base do assistente de voz Alice e do serviço de busca Yandex Search, pode ser utilizado livremente por desenvolvedores e pesquisadores.
Foram necessários 65 dias para treinar o modelo em um cluster de 800 placas gráficas A100 e 1,7 TB de textos online, livros e inúmeras outras fontes (inglês e russo).
O sistema pode ser utilizado livremente por desenvolvedores e pesquisadores: link para o repositório no GitHub.
Quando perguntado qual conceito teria de si mesmo, o modelo respondeu “Eu me vejo como um ser eterno“.