Google anuncia Gemma 3, modelo de IA que pode ser executado em uma única GPU
O Gemma 3 é uma nova coleção de modelos de IA abertos, baseados no Gemini 2.0. Os modelos estão disponíveis em versões de 1 bilhão, 4 bilhões, 12 bilhões e 27 bilhões de parâmetros, e são capazes de serem executados em dispositivos como smartphones e notebooks, permitindo que desenvolvedores criem aplicativos de IA para diferentes plataformas.
O Gemma 3 é compatível com mais de 35 idiomas de forma nativa e possui suporte pré-treinado para mais de 140. Além disso, ele é capaz de processar texto, imagens e vídeos curtos, contando com uma janela de contexto de 128 mil tokens para lidar com grandes volumes de informação.
Em testes no Chatbot Arena, o modelo Gemma 3 27B obteve 1338 pontos, posicionando-se entre o DeepSeek R1 (1363 pontos) e os modelos o3-mini (1304) e Llama3-405B (1269). Enquanto o DeepSeek R1 exige 32 GPUs H100 para execução e o Llama3-405B demanda 16, o Gemma 3 27B opera com apenas uma.
O Gemma 3 já está disponível em plataformas como Google AI Studio, Vertex AI e Hugging Face.