Gartner: GPT-5 здесь, но инфраструктура для поддержки True Agentic AI нет (пока)

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас


Вот аналогия: автострады не существовали в США до 1956 года, когда она представляла администрацию президента Дуайта Д. Эйзенхауэра, но в то же время очень быстрые, мощные автомобили, такие как Porsche, BMW, Jaguars, Ferrari и другие, были уже десятилетиями.

Вы могли бы сказать, что ИИ находится в той же точке поворота: в то время как модели становятся все более способными, исполнением и сложными, критическая инфраструктура, необходимая им для обеспечения истинных, реальных инноваций, еще не была полностью построена.

«Все, что мы сделали, — это создать несколько очень хороших двигателей для автомобиля, и мы очень взволнованы, как будто у нас есть эта полностью функциональная система автомагистрали», — сказал VentureBeat, Арун Чандрасекаран, выдающийся аналитик VP Gartner.

Это приводит к своего рода плато, в таких возможностях моделей, как GPT-5 Openai: хотя важный шаг вперед, он имеет только слабые проблески действительно агента.

«Это очень способная модель, это очень универсальная модель, она добилась некоторого очень хорошего прогресса в определенных областях», — сказал Чандрасекаран. «Но я считаю, что это скорее постепенный прогресс, а не радикальный прогресс или радикальное улучшение, учитывая все высокие ожидания Openai, которые были установлены в прошлом».

GPT-5 улучшается в трех ключевых областях

Чтобы быть ясным, OpenAI добился успехов с GPT-5, по словам Gartner, в том числе в кодирующих задачах и мультимодальных возможностях.

Чандрасекаран указал, что OpenAI разобрался, чтобы сделать GPT-5 «очень хорошим» при кодировании, четко воспользовавшись огромной возможностью Gen AI в области разработки программного обеспечения для предприятия и стремясь к лидерству конкурентов Anpropic в этой области.

Между тем, прогресс GPT-5 в модальностях за пределами текста, особенно в речи и изображениях, предоставляет новые возможности интеграции для предприятий, отметил Чандрасекаран.

GPT-5 также, если они тонко, продвигает агент AI и дизайн оркестровки благодаря улучшению использования инструмента; Модель может вызвать сторонние API и инструменты и выполнять параллельные вызова инструментов (одновременно обрабатывать несколько задач). Тем не менее, это означает, что корпоративные системы должны иметь возможность обрабатывать параллельные запросы API за один сеанс, отмечает Чандрасекаран.

Многоэтапное планирование в GPT-5 позволяет большей бизнес-логике находиться в самой модели, снижая необходимость во внешних двигателях рабочего процесса, а его более крупные контекстные окна (8 тыс. Для бесплатных пользователей, 32 тыс. На плюс по 20 долларов в месяц и 128 тыс. Для Pro-200 долларов в месяц) могут «изменить архитектуру искусственного интеллекта предприятия»,-сказал он.

Это означает, что приложения, которые ранее основывались на сложных конвейерах по извлечению-аугментированию (RAG) для работы вокруг контекстных ограничений, теперь могут передавать гораздо большие наборы данных непосредственно в модели и упростить некоторые рабочие процессы. Но это не значит, что тряпка не имеет значения; «Получение только самых релевантных данных по-прежнему быстрее и более экономически эффективнее, чем всегда отправлять массовые входы»,-отметил Чандрасекаран.

Гартнер видит переход к гибридному подходу с менее строгим поиском, при этом разработчики используют GPT-5 для обработки «больших, беспорядочных контекстов» при повышении эффективности.

На фронте стоимости GPT-5 «значительно» снижает плату за использование API; Затраты на высшем уровне составляют 1,25 долл. США на 1 миллион входных токенов и 10 долл. США на 1 миллион первых токенов, что делает их сопоставимыми с такими моделями, как Gemini 2,5, но серьезно подрывает Claude Opus. Тем не менее, соотношение входной/выходной цены GTP-5 выше, чем в более ранних моделях, которые лидеры ИИ должны учитывать при рассмотрении GTP-5 для сценариев высокого уровня использования, посоветовал Чандрасекаран.

Пока в предыдущих версиях GPT (вроде)

В конечном счете, GPT-5 предназначен для того, чтобы в конечном итоге заменить GPT-4O и серии O (изначально они были закатом, а затем некоторые вновь введены OpenAI из-за несогласия пользователя). Три размера моделей (Pro, Mini, Nano) позволит архитекторам предоставлять услуги уровня на основе потребностей затрат и задержек; Простые запросы могут быть обработаны с помощью меньших моделей и сложных задач по полной модели, отмечает Gartner.

Тем не менее, различия в форматах вывода, памяти и поведения, получающих функции, могут потребовать проверки и корректировки кода, а также поскольку GPT-5 может сделать некоторые предыдущие обходные пути устаревшими, разработчики должны проверять свои шаблоны быстрого и системные инструкции.

В конечном итоге закатывая предыдущие версии, «я думаю, что Openai пытается сделать, так это абстрактно этот уровень сложности от пользователя», — сказал Чандрасекаран. «Часто мы не лучшие люди, чтобы принимать эти решения, и иногда мы можем даже принимать ошибочные решения, я бы сказал».

Еще один факт, стоящий за поэтапными перерывами: «Мы все знаем, что у Openai есть проблема с возможностями»,-сказал он, и, таким образом, подключил партнерские отношения с Microsoft, Oracle (Project Stargate), Google и другими, чтобы обеспечить вычислительную мощность. Запуск нескольких поколений моделей потребует нескольких поколений инфраструктуры, создавая новые последствия для затрат и физические ограничения.

Новые риски, советы по принятию GPT-5

OpenAI утверждает, что снижает показатели галлюцинации до 65% в GPT-5 по сравнению с предыдущими моделями; Это может помочь снизить риски соответствия и сделать модель более подходящей для вариантов использования предприятий, а ее объяснения цепочки мыслей (COT) поддерживают аудит и регулирующий выравнивание, отмечает Гартнер.

В то же время эти более низкие показатели галлюцинации, а также усовершенствованные рассуждения GPT-5 и мультимодальная обработка могут усилить неправильное использование, такое как продвинутая мошенничество и генерация фишинга. Аналитики сообщают, что критические рабочие процессы остаются под обзором человека, даже если при меньшей выборке.

Фирма также советует лидерам предприятия:

  • Пилот и эталонный GPT-5 в критически важных случаях использования, проводя бок оценочных оценок против других моделей, чтобы определить различия в точности, скорости и пользовательском опыте.
  • Следите за практикой, такими как Vibe, кодируя, что воздействие данных о рисках (но не оскорбляя это или рискует дефектами или сбоями в отношении ограждения).
  • Пересмотреть политику управления и руководящие принципы для решения новых модельных поведений, расширенных контекстных окон и безопасных завершений, а также калибровать механизмы надзора.
  • Экспериментируйте с интеграцией инструментов, параметрами рассуждения, кэшированием и размером модели для оптимизации производительности и используйте встроенную динамическую маршрутизацию, чтобы определить правильную модель для правильной задачи.
  • Аудит и обновление планов расширенных возможностей GPT-5. Это включает в себя проверку квот API, аудиторские маршруты и мультимодальные конвейеры для поддержки новых функций и повышенную пропускную способность. Строгое интеграционное тестирование также важно.

Агентам не просто нужно больше вычислить; Им нужна инфраструктура

Без сомнения, агент AI — это «супер горячая тема сегодня», отметил Чандрасекаран и является одной из главных областей для инвестиций в Hype Cycle Gartner 2025 для Gen AI. В то же время, технология достигла «пика завышенных ожиданий» Гартнера, что означает, что она стала широко распространенной рекламой из -за ранних историй успеха, в свою очередь, возлагая нереалистичные ожидания.

Эта тенденция обычно сопровождается тем, что Гартнер называет «впадиной разочарования», когда интерес, волнение и инвестиции охлаждают, поскольку эксперименты и реализации не могут обеспечить (помните: с 1980 -х годов было два примечательных зимы ИИ).

«Многие поставщики раскручивают продукты, помимо того, на что способны продукты», — сказал Чандрасекаран. «Это почти как будто они позиционируют их как готовые к производству, готовы к предприятиям и будут обеспечить бизнес-ценность за очень короткий промежуток времени».

Однако, в действительности, пропасть между качеством продукта по сравнению с ожиданиями широкая, отметил он. Gartner не видит агентского развертывания в масштабах всего предприятия; Те, кого они видят, находятся в «маленьких, узких карманах» и конкретных доменах, таких как программная инженерия или закупки.

«Но даже эти рабочие процессы не являются полностью автономными; они часто являются либо человеческими, управляемыми или полуавтономными по своей природе»,-объяснил Чандрасекаран.

Одним из ключевых виновных является отсутствие инфраструктуры; Агенты требуют доступа к широкому набору корпоративных инструментов и должны иметь возможность общаться с хранилищами данных и приложениями SaaS. В то же время должны быть адекватные системы управления идентификацией и доступом, чтобы контролировать поведение и доступ агентов, а также надзор за типами данных, к которым они могут получить доступ (не лично идентифицируемый или конфиденциальность), отметил он.

Наконец, предприятия должны быть уверены, что информация, которую производят агенты, заслуживает доверия, что означает, что она свободна от предвзятости и не содержит галлюцинации или ложную информацию.

Чтобы добраться туда, поставщики должны сотрудничать и принять более открытые стандарты для агента до инспекции и общения с агентом-агентом, сообщили он.

«В то время как агенты или базовые технологии могут добиться прогресса, эта оркестровая, управление и уровень данных все еще ждут, чтобы их можно было построить для процветания агентов», — сказал Чандрасекаран. «Вот где мы видим много трения сегодня».

Да, индустрия делает прогресс с рассуждениями по ИИ, но все еще изо всех сил пытается заставить ИИ понять, как работает физический мир. ИИ в основном работает в цифровом мире; Он не имеет сильных взаимодействий с физическим миром, хотя в пространственной робототехнике делаются улучшения.

Но «мы очень, очень, очень, очень ранние стадии для такого рода среды», — сказал Чандрасекаран.

Чтобы по -настоящему сделать значительные успехи, требуется «революция» в архитектуре или рассуждениях моделей. «Вы не можете быть на текущей кривой и просто ожидать большего количества данных, больше вычислений и надежды добраться до AGI», — сказала она.

Это очевидно в долгожданном развертывании GPT-5: конечной целью, которую Openai определил для себя, была AGI, но «действительно очевидно, что мы далеко не близки к этому»,-сказал Чандрасекаран. В конечном счете, «мы все еще очень, очень далеко от Аги».



Источник

Рекомендуем

Оставить комментарий