Элон Маск представил Grok 4 прошлой ночью, назвав его «самым умным искусственным интеллектом в мире» — что нужно знать предприятиям — Новости искусственного интеллекта и технологий

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

После нескольких дней споров, связанных с волнением антисемитских ответов, которые недавно были сделаны его чат-ботом с Grok AI, в его социальной сети X (ранее Twitter), казалось бы, нераскаявшийся и незвучный Элон Маск, выпустил последнюю версию своей семейства моделей ИИ, Grok 4, во время прогонки событий вчера вечером, вызывая его «умным самым в мире».

Как написал Маск на X: «Grok 4-это первый раз, по моему опыту, что ИИ смог решить сложные, реальные инженерные вопросы, где ответы не могут быть найдены нигде в Интернете или в книгах. И это станет намного лучше».

Новый релиз фактически включает в себя две различные модели: Грок 4модель рассуждений с одним агентом, и Грок 4 тяжелыймногоагентная система, предназначенная для решения сложных задач посредством внутреннего сотрудничества и синтеза.

Обе модели оптимизированы для рассуждений и поставляются с нативной интеграцией инструментов, позволяя таким возможностям, как веб -поиск, выполнение кода и мультимодальный анализ.

Маск и его команда в XAI демонстрировали тесты, которые предполагают, что Grok 4 превзойдет всех нынешних конкурентов по ряду академических и кодировочных оценок, даже по сравнению с ранее ведущими конкурентами по моделям ИИ, такими как OpenAI O3 и Google Gemini.

Однако Xai еще не выпустил модель карта Или любая официальная документация по выпуску GROK 4 для общественности, что делает их сложной задачей самостоятельно оценивать ее эффективность и претензии, представленные во время потока. Мы обновим, если/когда они станут доступны.

На прошлой неделе Маск и его члены команды XAI не участвовали в явных противоречиях, с которыми сталкивались Гроки, включая многие случаи, когда Гроки делали антисемитные замечания или называют себя «мехахитлером», и предполагают, что люди с еврейскими фамилами должны рассматриваться в течение всего 6 -го ев.

Самый близкий мускус пришел в том, что он заявил: «Я считаю, что самое важное для безопасности ИИ-по крайней мере, моя биологическая нейронная сеть говорит мне самое важное-это максимально ищет правду», и «нам нужно убедиться, что ИИ-это хороший ИИ. Хороший Грок», а также «важно привить ценностям, который вы хотите, чтобы ребенок выросли, и невероятно мощный».

Тем не менее, Маск не извинился и не взял на себя ответственность за антисемитские, сексуально оскорбительные и заговорщики Грока. Вот копия полного потока:

На протяжении всей прямой трансляции команда подчеркивала способность Grok 4 рассуждать из первых принципов, исправлять свои собственные ошибки и потенциально изобретать новые технологии или раскрыть новые научные идеи.

Презентация также включала демонстрации Grok 4 Heavy, который применяет многоагентное сотрудничество для решения проблем на уровне исследований в разных дисциплинах.

Доступность и цены

Grok 4 доступен сейчас по нескольким каналам, в зависимости от типа пользователя и уровня подписки:

API Access (для разработчиков и предприятий):
Grok 4 и Grok 4 Heavy живут через XAI APIПолем Цены структурированы следующим образом:
- 3 доллара на 1 миллион входных токенов
- 15 долларов США на 1 миллион токенов
- 0,75 долл. США на 1 миллион кэшированных токенов
- Цены вдвое после 128 000 жетонов в одном контекстном окне
  API поддерживает входы текста и изображений, вызов функций, структурированные выходы и предлагает окно контекста 256 000.
Доступ к потребителям (через grok Chatbot и приложения):
Отдельные пользователи могут получить доступ к GROK 4 через Grok Chatbot на x, Приложение Grok (iOS и Android), и X.comно только с одной из следующих подписок:
- Premiumplus: 16 долларов в месяц
- Supergrok: 300 долларов в месяц
- Новый «Supergrok Heavy» Уровень, также по цене 300 долларов в месяцпредоставляет доступ к И Grok 4, и Grok 4 тяжелыемногоагентный вариант.
  (ПРИМЕЧАНИЕ: Supergrok и Premiumplus Lears могут отличаться от квот на доступность и использование на платформах X и Grok.)
Время запуска:
Grok 4 стал доступен сразу после 9 июля 2025 г. прямая трансляция. Во время демонстрации были установлены временные пределы доступа, но вскоре началось полное развертывание подписчиков.
Расширение платформы:
XAI указал на планы по предоставлению Grok 4 доступным через Microsoft Azure Ai Foundryгде в настоящее время перечислены Grok 3 и Grok 3 Mini.

Для получения подробной информации пользователи направлены на поддержку X.AI/GROK и X Premium. Вот как это сравнивается с другими ведущими моделями ИИ с точки зрения цен на миллион токенов.

Провайдер и модель	Контекст окна	Вход ($/Mtok)	Кэшированный вход	Выход ($/Mtok)	Дополнительные примечания
xai — grok 4/4 тяжелый	256 К (2 × цена> 128 К)	$ 3,00	$ 0,75	$ 15,00	Ввод изображения, вызов функции, структурированный json (apidog)
Openai — O3	200 к	$ 2,00	$ 0,50	$ 8,00	Доступна 50 % скидки с партией-API (OpenAI, справочный центр OpenAI)
GPT-4O	128 к	$ 5,00	$ 2,50	$ 20,00	Видение, аудио, инструменты (OpenAI)
Антропический — Клод Сонет 4	200 к	$ 3,00	$ 0,30	$ 15,00	Выходная скидка на 50 % (антроп)
Claude Opus 4	200 к	$ 15,00	$ 1,50	$ 75,00	Флагман с высокой точностью (антроп)
Google — Gemini 2.5 Pro	200 К (2 × цена> 200 К)	$ 1,25	$ 0,31	$ 10,00	75 % кэш -дисконтирование (Google AI для разработчиков, Google Cloud)
Gemini 2.5 Flash	200 к	$ 0,30	$ 0,075	$ 2,50	Быстрый, дешевый просмотр уровня (Google Cloud)
DeepSeek-Deepseek-Reasoner	64 к	0,55 долл. США (мисс) / 0,14 долл. США (хит)	$ 0,14	$ 2,19	50-75 % скидки с пиковой пиковой

Плетение местных рассуждений и использования инструментов

В отличие от своего предшественника Grok 3, выпущенного в феврале, который отделил ответы с инструментами от общих рассуждений, Grok 4 был обучен инструментами с самого начала.

Модель объединяет такие возможности, как выполнение кода, поиск в Интернете и анализ документов. Это также представляет Грок 4 тяжелыймногоагентная система, в которой несколько внутренних моделей работают параллельно, чтобы генерировать и проверять ответы.

Grok 4 также включает в себя новый голосовой режим Показывая выразительные выходы с уменьшенной задержкой, а также поддержку ввода текста и изображения, структурированные выходы и вызова функций.

Производительность

Независимый анализ модели ИИ и анализа сравнительного анализа искусственного анализа заявил, что XAI предоставил ему версию GROK 4 (не тяжелый) раньше, чем публичный выпуск для оценки.

Что касается технических тестов, Grok 4 возглавляет индекс интеллекта искусственного анализа со счетом 73, опередив конкурентов, таких как O3 (70) Openai (70) и Google Gemini 2.5 Pro (70).

Он также записал лучшие результаты в:

GPQA Diamond: 88%
Arc-Agi 2: 15,9%, удваивает второй лучший результат
Гуманитарный последний экзамен: 24% в версии только для текста и 44% с инструментами
MMLU-PRO и AIME 2024: 87% и 94% соответственно
Кодирование и оценка математики: Самый высокий до настоящего времени на LiveCodebench, Scicode, AIME24 и Math-500

Несмотря на свой контрольный успех, Grok 4 Выходная скорость составляет 75 токенов в секунду — с их моделями, такими как Gemini 2,5 Flash (353) или O3 Openai (187), но все же быстрее, чем Claude 4 Anthropic (66).

Модель имеет 256 000 ток-контекста окнокоторый расположен выше пределов контекста 200 тыс. и Claude 4 сонет, но ниже 1 миллиона токенов, предлагаемых Gemini 2.5 Pro и GPT-4.1.

Примеры использования в реальном мире

XAI предоставил несколько демонстраций производительности Grok 4 в прикладных сценариях:

В моделируемой бизнес -задаче под названием VendingBenchGrok 4 значительно превзошел другие модели в финансовом планировании Long Horizon.
В ARC Instituteисследователи использовали Grok 4 для анализа журналов CRISPR и раскрытия новых гипотез.
В радиологиямодель интерпретировала рентгеновские снимки грудной клетки с более высокой точностью, чем ведущие сверстники.
В финансовый секторего сочетание доступа к данным и рассуждениям в реальном времени сделало его подходящим для прогнозирования и анализа.

Модель также может создать 3D видеоигры с минимальным входом путем автономного поиска и интеграции активов. Кроме того, он продемонстрировал возможности имитировать астрофизические события с использованием обоснованных приближений из опубликованных исследований.

Прием и обсуждение

Реакция отрасли на запуск GROK 4 была разделена, с энтузиазмом по поводу его выполнения, компенсируя критику о доставке и более широком доверии.

Дэвид ШапироПользователь и писатель ИИ Power отметил: «Grok 4 теперь занимает свое место как« достаточно умный, чтобы на самом деле помочь с пограничными исследованиями »… но просто догнал Openai».

Итан МолликПрофессор Wharton, отметил X: «Таким образом, у Grok 3 было три отдельных инцидента, в которых, по-видимому, невыполненные изменения в развернутой системе вызвали крупномасштабную этическую проблему и аварийный откат. Я не думаю, что вы можете сделать запуск Grok 4, который, по крайней мере, не решается, если честно, если пользовательский доверие имеет значение,-потом добавить Grok 3, и GROK 4 очень хороша, но очень хорошо, но очень хорошо, но очень хорошо, но очень удивительно, но очень удивительно, но очень хорошо, но очень хорошо, но очень хорошо, но очень удивительно, но очень удивительно, но очень удивительно, но очень хорошо, но очень удивительно, но очень хорошо, но очень хорошо, но очень хорошо, но очень удивительно, но очень удивительно, но очень удивительно, но очень хорошо не очень хорошо, но очень хорошо не очень хорошо, но очень хорошо-это очень хорошо, но очень хорошо-это очень хорошо, но очень удивительно, но очень удивительно. Модели там.

Бен Хаяксоучредитель и технический директор AI Product Product Startup Startup Startup Rainprop AI (сам бывший сотрудник мускуса) раскритиковал саму прямую трансляцию: «Эта прямая трансляция XAI-одна из худших вещей, которые я когда-либо смотрел в своей жизни. Люблю вас все, но это плохо».

Несмотря на критику, искусственный анализ фирменной фирмы отметил: «Grok 4 теперь является ведущей моделью искусственного интеллекта».

Продолжающиеся проблемы доверия

Запуск Grok 4 на фоне новой критики за предыдущее поведение Грока в развертываниях потребителей, особенно в качестве чата, интегрированного в социальную сеть Маск, X.

В течение отпуска 4 июля и в последующие дни Грок генерировал антисемитские и заговорщические ответы, которые подтвердили проверку по поводу своей практики проектирования и управления системой.

Как сообщил мой коллега из VentureBeat Майкл Ф. Нуньес, Грок ответил на вопросы о влиянии еврейского влияния в Голливуде, утверждая, что еврейские руководители «доминируют в лидерстве» в основных студиях и влияют на содержание с помощью «прогрессивных идеологий», и продолжали разглагольствовать о людях о потерпе Время, очевидная ссылка на Холокост.

Заговорщическая и антисемитическая публикация была настолько плодовитой, Антидиффамационная лига (ADL), выдающаяся некоммерческая некоммерческая организация, борьба с антисемитизмом и ненавистью. Растущий на Х и многие другие платформы ».

Этот инцидент следует за историей проблемных результатов GROK, в том числе случай в мае 2025 года, когда бот Grok, интегрированный в X, случайно вставленные ссылки на совершенно бессмысленные и нереальные «белый геноцид» в Южной Африке в не связанные с ними запросы, и предыдущий случай, когда его система была обнаружена, направленная на Grok Chatbot на x, чтобы избежать ссылки на то, что они не имеют никаких высказываний. распределители дезинформации. В обоих случаях XAI обвинил поведение на неназванных сотрудниках и заявил, что их решают.

Сегодня, сегодня пользователи Grok 4 в приложении потребителя наблюдали, как его снова выводят антисионистские и антисемитские замечания:

Как я уже отмечал, Маск несколько раз открыто заявлял, что он хотел изменить Грока, чтобы лучше отразить свои личные убеждения и недоверие в основных средствах массовой информации и аккредитованных источниках. Это делает его плохим источником в контекстах предприятия, где такие взгляды могут отрицательно повлиять на пользователей и предприятия, строящие на вершине семейства моделей Grok.

Моя предыдущая рекомендация остается: для тех, кто на предприятии, пытающихся обеспечить должным образом и точно работать продукты ИИ в своем бизнесе … Гроку, к сожалению, лучше избегать. К счастью, есть множество других альтернатив на выбор.

Источник

Элон Маск представил Grok 4 прошлой ночью, назвав его «самым умным искусственным интеллектом в мире» — что нужно знать предприятиям

Доступность и цены

Плетение местных рассуждений и использования инструментов

Производительность

Примеры использования в реальном мире

Прием и обсуждение

Продолжающиеся проблемы доверия

Самое важное из первого подкаста OpenAI: AGI, GPT-5 и будущее ИИ

Защищено 8,8 трлн долларов: как один CISO перешел от «это BS» к пуленепробиваемому за 90 дней

Рекомендуем

Оставить комментарий Отменить ответ