Executando verificação de segurança...
7

Método promete reduzir em até 95% o consumo de energia de IA sem comprometer a qualidade, segundo pesquisadores

A técnica consiste em utilizar a Multiplicação de Complexidade Linear (L-Mul), que substitui multiplicações em ponto flutuante, tradicionalmente exigentes em termos de energia, por adições inteiras mais simples nos cálculos de IA.

O ponto flutuante é uma representação matemática que permite aos computadores manipular números muito grandes e muito pequenos de forma eficiente, ajustando a posição do ponto decimal. Essa abordagem é essencial para muitos cálculos em modelos de IA, mas demanda muita energia e poder computacional.

Estima-se que o ChatGPT consuma 564 MWh diariamente, e que a indústria de IA possa chegar a um consumo anual entre 85 e 134 TWh até 2027, equivalente a de operações de mineração de Bitcoin.

Os resultados indicam que a utilização do L-Mul exigiria 95% menos energia para processar informações e 80% menos para gerar novas ideias. Testes em processamento de linguagem natural, tarefas de visão e raciocínio simbólico mostraram uma redução média no desempenho de apenas 0,07%. Além disso, avaliações em modelos populares, como Llama, Mistral e Gemma, revelaram até mesmo um ganho de precisão em certas tarefas de visão.

A pesquisa demonstra que multiplicar dois números em float8, o formato atualmente utilizado pelos modelos de IA, requer 325 operações, enquanto o L-Mul utiliza apenas 157, o que representa menos da metade.

No entanto, essa técnica demanda um tipo especial de hardware, que atualmente não está otimizado para seu pleno aproveitamento, embora essa situação possa mudar no futuro.

Carregando publicação patrocinada...