Стартап xAI Илона Маска представил Grok 4 — «самую мощную в мире ИИ-модель». Также запущен новый тарифный план SuperGrok Heavy за $300 в месяц.
Предприниматель сообщил, что новый искусственный интеллект смог решить сложные инженерные вопросы, ответы на которые невозможно найти в интернете или книгах.
Во время прямой трансляции он сообщил, что новый чат-бот превосходит уровень доктора философии по всем предметам.
Дополнительно представлена модель Grok 4 Heavy — мультимодальная версия Grok с повышенной производительностью. Согласно заявлению главы xAI, нейросеть запускает несколько агентов для одновременного решения задачи, после чего они сопоставляют свои ответы для поиска наилучшего результата.
Grok 4 показал высокие результаты в ряде бенчмарков, включая Humanity’s Last Exam — тест, оценивающий способность ИИ отвечать на тысячи пользовательских вопросов по математике, гуманитарным и естественным наукам. Чат-бот набрал 25,4% на этом экзамене, обойдя Gemini 2.5 Pro от Google (21,6%) и o3 от OpenAI (21%).
В ARC-AGI-2 Grok достиг нового передового результата — 16,2%. Тест включает в себя задачи-головоломки, в которых ИИ необходимо распознать визуальные шаблоны.
Помимо доступа к высокопроизводительной версии Grok подписчики SuperGrok Heavy смогут попробовать находящиеся в разработке продукты компании:
Также новый тариф предложит:
xAI выпускает Grok 4 через API. Разработчики могут создавать приложения на его основе.
В ходе презентации продемонстрировали возможности Grok 4. Модель умеет распознавать видеоигры и оценивать их увлекательность, а также анализировать данные из X и формулировать прогнозы на Polymarket.