Google выпустила семейство открытых моделей Gemma 4 

Компания Google представила Gemma 4 — новое семейство открытых ИИ-моделей для продвинутых рассуждений и агентных рабочих процессов. 

С момента запуска первого поколения разработчики скачали Gemma более 400 млн раз, создав свыше 100 000 вариантов моделей в экосистеме Gemmaverse. Последняя версия создана на основе тех же исследований и технологий, что и чат-бот Gemini 3. 

Семейство нейросетей Gemma 4 включает четыре версии: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) и 31B Dense. 

Компактные E2B и E4B на 2,3 млрд и 4,5 млрд активных параметров делают ставку на мультимодальность, низкую задержку и бесшовную интеграцию. Их можно запустить на смартфоне или обычном ноутбуке.

Для работы 26B MoE и флагманской 31B (на 26 млрд и 31 млрд параметров) необходим графический ускоритель уровня Nvidia H100 с 80 ГБ памяти. Эти модели оптимизированы для исследователей и разработчиков. 

Старшие версии показывают высокие результаты в бенчмарках. В мировом рейтинге открытых текстовых моделей Arena AI флагманская 31B занимает третье место, а 26B — шестое. По словам разработчиков, новая линейка превосходит аналоги от конкурентов, которые крупнее в 20 раз.

Одно из главных преимуществ Gemma 4 — развитые способности к рассуждению. Модели могут выстраивать сложную логику и планировать задачи в несколько этапов. Они показывают значительный прогресс в бенчмарках по математике и точно следуют инструкциям. 

Среди других особенностей: 

Gemma 4 уже доступна в Google AI Studio и Google AI Edge Gallery. Интеграцию также поддерживают популярные сторонние инструменты и фреймворки, включая Hugging Face, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM и LM Studio.

Модели можно настраивать через Google Colab, Vertex AI или на локальных видеокартах. Для продакшена доступно развертывание на Google Cloud, включая Cloud Run, GKE и Sovereign Cloud.