DeepMind descobre que LLM consegue comprimir arquivos de imagem e áudio, sem perda de dados, melhor do que PNG e FLAC
O modelo Chinchilla 70B comprimiu o banco de dados de imagens ImageNet para 43,4% de seu tamanho original, superando o algoritmo PNG no mesmo conjunto (58,5%.) Para áudio, o LibriSpeech foi reduzido para 16,4% de seu tamanho original, superando a compressão em FLAC (30,3%). O resultado é ainda mais interessante ao se considerar que alguns cientistas da computação propõem que a capacidade de compactar dados de forma eficaz é semelhante a uma forma de inteligência geral – a noção de que entender o mundo envolve identificar padrões, reduzindo um grande conjunto de dados a um tamanho gerenciável.