Категория:

Новости

Объявление наших финалистов инновационных инноваций VB 2025 года.

admin 20.06.2025

admin

Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

В этом году VB Финалисты «Инновации» будут в VB Transform, 24-25 июня, в Сан-Франциско. Они выйдут на сцену, когда мы углубимся в то, что на самом деле работает в Enterprise AI, от копирований до агентов.

Семь компаний были выбраны для демонстрации своих генеративных продуктов ИИ или функций, которые, скорее всего, нарушат предприятие.

Те, кто выбрал для представления, сделают это перед приглашенной аудиторией из 600 лиц, принимающих решения в отрасли, и получат прямые отзывы от коллегии судьи VC.

Финалисты инноваций в инновациях 2025 года:

Ctgt

Основанная в 2024 году командой Стэнфорда и Калифорнийского университета, исследователями в Сан-Диего, CTGT в Сан-Франциско-это платформа управления рисками искусственного интеллекта, предназначенная для изменения того, как предприятия развертывают генеративный ИИ. В отличие от обычных трубопроводов AI, которые требуют периодических автономных обновлений, платформа CTGT обеспечивает непрерывный мониторинг в реальном времени и автоматизированное уточнение моделей в производстве, позволяя системам искусственного интеллекта учиться и адаптироваться в живых средах, даже не выходя из строя. Это означает, что модели улучшаются на лету, сокращая разрыв между разработкой и развертыванием и обеспечение максимального времени безотказной работы и надежности для критически важных приложений искусственного интеллекта.

Компания собрала семян 7,2 миллиона долларов в феврале.

Кат

Catio на базе Palo Alto-это платформа с AI, предназначенная для того, чтобы помочь компаниям в оптимизации их архитектуры технических стеков. Платформа представляет собой копило для технических лидеров и команд, предоставляющий данные, основанные на данных и рекомендации для оценки, планирования и развития своей технологической инфраструктуры. Catio решает эти проблемы, предоставляя непрерывный дизайн архитектуры, стратегическое планирование технического стека, точную аналитику и оценку архитектур, а также персонализированные рекомендации для уникальных потребностей каждого предприятия, все это обеспечивает расширенные модели ИИ и запатентованные данные.

В марте Catio объявил о дополнительном финансировании 3 миллиона долларов. Это в дополнение к 4 миллионам долларов, привлеченных в период с 2023 по 2024 годы.

Кумо

Kumo AI, основанный на Маунтин-Вью, сосредоточен на демократизации ИИ, особенно в сфере прогнозирующей аналитики, путем использования передовых нейронных сетей графов (GNN) и глубокого обучения реляции (RDL). Они стремятся облегчить предприятиям создание и развертывание очень точных моделей машинного обучения непосредственно из их реляционных данных.

Кумо собрал 37 миллионов долларов в двух раундах. В сентябре 2022 года их последний раунд — серия B Series B за 18 миллионов долларов.

Solo.io

Cambridge, Mass. Solo.io-это облачная сеть приложений, которая предоставляет решения для подключения, защиты и наблюдения современных приложений, особенно тех, которые построены на Kubernetes и микросервисах. Основанный в 2017 году, Solo.io стремится упростить сложности прикладных сетей в динамических, много облачных средах. Компания запустила Kagent-первую в своем роде нативную структуру облака, которая помогает DevOps и инженерам платформы создавать и запускать агенты искусственного интеллекта в Kubernetes.

В 2021 году раунд финансирования в размере 135 миллионов долларов США принес общий финансирование компании до 175 миллионов долларов. Компания оценивается в 1 миллиард долларов.

SuperDuper.io

Berlin Superduper.io-это компания по искусству, ориентированная на упрощение интеграции моделей ИИ и рабочих процессов непосредственно в существующих базах данных, устраняя необходимость в сложных конвейерах данных и отдельной инфраструктуре ИИ. Их основное предложение-их агенты Superduper, которые позволяют нетехническим пользователям мгновенно отвечать даже на самые сложные вопросы об их данных, документах и системах-и создавать работников ИИ для их задач-просто общаясь с готовыми агентами искусственного интеллекта. Все без споров с трудными инструментами, электронными таблицами, панелями мониторинга и SQL или требуют помощи от технических и аналитиков.

SuperDuper.io собрал 1,75 миллиона долларов в одном раунде семян. Примечательными инвесторами включают Hetz Ventures, Session.vc и Mongodb. Это также было частью программы Intel Ignite Accelerator.

Сутро

Sutro на базе Oakland-это платформа без AI, которая позволяет пользователям создавать полные, готовые к производству мобильные и веб-приложения, просто описывая их идею в простом тексту. Он стремится демократизировать разработку программного обеспечения, что делает его доступным для отдельных лиц и предприятий без опыта кодирования.

Sutro был основан в 2021 году и в 2023-2024 годах собрал около 6 миллионов долларов в двух ранних раундах финансирования.

Qdrant

Берлинский Qdrant-это высокопроизводительная, массивная векторная база данных и поисковая система векторной векторной системы, предназначенная для следующего поколения приложений искусственного интеллекта. Он построен в Rust, языке, известном своей безопасностью и производительностью, что делает его надежным выбором для требования рабочих нагрузок искусственного интеллекта.

Основанная в 2020 году, Qdrant привлек 37,8 млн. Долл. США в течение трех раундов финансирования, последним из которых был 28 миллионов долларов в январе 2024 года.

Познакомьтесь с нашей судейской комиссией

Эмили Чжао, директор Salesforce Ventures

Чжао является директором в Salesforce Ventures, сосредоточенном на AI/ML. Она также проводит время на инструментах разработчика, кибербезопасности, вертикальной SaaS и технологии здравоохранения. Она присоединилась к Salesforce Ventures весной 2022 года и недавно помогла запустить свой генеративный ИИ фонд в размере 500 миллионов долларов. Она возглавила несколько инвестиций в фонд, в том числе обнимающееся лицо, взлетно -посадочную полосу, антроп, коуэр и другие.

До прихода в Salesforce Ventures, Чжао была инвестором в Avenir Growth Capital, венчурном фонде, базирующемся в Нью-Йорке, где она провела большую часть своего времени на вертикальном SaaS, медицинском и прикладном программном обеспечении. До Авенира Эмили была ассоциированной в отдельной инвестиционной группе в Блэкстоуне и инвестировала в корпоративные операции по выкупам.

Мэтт Крангинг, партнер Menlo Ventures

Kraning — один из новейших партнеров Menlo. Он сосредоточен на инвестициях в ИИ, предприятие SaaS, национальную оборону и кибербезопасность.

Он глубоко технический бывший основатель и проверенный строитель компании с доктором наук. в электротехнике, специализируясь на искусственном интеллекте и крупномасштабных вычислениях. Перед Менло Крэнинг был соучредителем и техническим директором Expanse, где он помог определить категорию управления поверхностью атаки, управляемую AI. Он также консультируется и инвестировал в более чем 50 стартапов, в том числе единорогов, таких как Peregrine и Astranis, и недавно возглавил раунд в размере 12 миллионов долларов для WISPR Flow.

Ребекка Лидиректор по инвестициям в Amex Ventures

Ли является инвестиционным директором в Amex Ventures. Она присоединилась в 2024 году, чтобы сосредоточиться на инвестировании в корпоративное программное обеспечение, что привело к инвестициям на ранней стадии в программное обеспечение для инфраструктуры, инструменты разработчиков, данные и искусственное интеллект.

Прежде чем присоединиться к American Express, LI возглавлял Fintech и Software Venture Investments в Global Asset Capital. Ее предыдущий опыт включает в себя развитие бизнеса и партнерские отношения в Credit Karma и Technology Private Equity Investing в GIC.

Приходите посмотреть на VB Transform

Все поля будут происходить 25 июня с 4:45 до 17:30 Pt. На главной сцене для наших личных участников.

Ведущие будут иметь три минуты для своего шага, а затем две минуты обратной связи от судейской группы. Награды будут представлены в трех категориях: 1) Скорее всего, достигнут успеха, 2) самая крутая технология и 3) лучший стиль презентации.

Прочитайте о победителях VB Transform 2024: Sambanova, Instabase и Tabnine.

Источник

Новости

OpenAI Open поставлял новую структуру агента по обслуживанию клиентов — узнайте больше о растущей стратегии предприятия

admin 19.06.2025

admin

Примечание редактора: Карл будет руководить редакционным круглым столом по этой теме на VB Transform на следующей неделе. Зарегистрируйтесь сегодня.

OpenAI выпустил новую демонстрацию с открытым исходным кодом, которая дает разработчикам практический взгляд на то, как создать интеллектуальных, с помощью AI-агентов с помощью рабочих процессов с использованием агентов SDK.

Как впервые заметил ИИ влиятельный и инженер Тибор Блахо (из стороннего расширения браузера Chatgpt AIPRM), новый Агент по обслуживанию клиентов Был опубликован ранее сегодня на сообществе сообщества, обнимающего обнимание сообщества, обнимающееся по разрешению MIT, означает, что любой сторонний разработчик или пользователь может взять код, изменить его и развернуть его бесплатно для собственных коммерческих или экспериментальных целей.

Этот пример агента демонстрирует, как направить запросы, связанные с авиакомпаниями, между специализированными агентами-например, бронирование места, статус полета, отмена и часто задаваемые вопросы-при соблюдении защиты и релевантности.

Релиз предназначен для того, чтобы помочь командам выйти за рамки теоретического использования и с уверенностью начать управлять агентами.

Эта практическая демонстрация прибывает прямо перед предстоящей презентацией Openai в VentureBeat Transform 2025 На следующей неделе в Сан-Франциско, 24-25 июня, где глава платформы Openai Olivier Godement углубится в архитектуру агента корпоративного уровня в таких компаниях, как Stripe и Box.

Olivier Godement, глава продукта Openai, платформа — Познакомьтесь с Olivier Godement, главой продукта Openai, платформой на VB Transform 2025

План маршрутизации, ограждения и специализированных агентов

Сегодняшний релиз включает в себя как бэкэнд Python, так и Frontend Next.js. Бэкэнд использует агенты OpenAI SDK для организации взаимодействия между специализированными агентами, в то время как фронт визуализирует эти взаимодействия в интерфейсе чата, показывая, как решения и передача передач разворачиваются в режиме реального времени.

В одном потоке клиент просит сменить место. Агент сортировки определяет запрос и направляет его к агенту бронирования сидений, что подтверждает изменение бронирования интерактивно. В другом сценарии запрос на отмену полета обрабатывается через агент отмены, который подтверждает номер подтверждения клиента перед выполнением задачи.

Важно отметить, что демонстрация также показывает, как ограждения функционируют в производстве: Актуальность ограждения блокирует внебрачные запросы, такие как просьба о поэзии, в то время как Джаклбрейк Guardrail Предотвращает оперативные попытки впрыска, такие как запросы на разоблачение системных инструкций.

Архитектура отражает реальную поддержку авиакомпании, показывая, как организации могут создавать ассистентов, ориентированных на домен, которые являются отзывчивыми, совместимыми и соответствующими ожиданиям пользователей. OpenAI выпустил код по лицензии MIT и призвал команды настраивать и адаптировать его для своих собственных потребностей.

От открытого исходного кода до реального мира. Вцена об использовании предприятий: прочитайте фонды Openai для создания практических агентов искусственного интеллекта

Этот релиз с открытым исходным кодом основывается на более широкой инициативе Openai, чтобы помочь командам разрабатывать и развернуть агентские системы в масштабе.

Ранее в этом году компания опубликовала «Практическое руководство по строительным агентам”32-страничное руководство для команд продуктов и инженеров, стремящихся внедрить интеллектуальную автоматизацию.

Руководство излагает основополагающие компоненты-модель LLM, внешние инструменты и поведенческие инструкции-и охватывает стратегии для создания как одноагентных систем, так и сложных многоагентных архитектур. Он предлагает шаблоны проектирования для оркестровки, реализации ограждения и наблюдения, опираясь на опыт Openai, поддерживая крупномасштабные развертывания.

Ключевые выводы из руководства включают:

Выбор модели: Используйте модели высшего уровня, чтобы установить базовые показатели производительности, а затем экспериментировать с меньшими моделями для экономической эффективности.
Интеграция инструмента: Обороните агентам с внешними API или функциями для извлечения данных или выполнения действий.
Образование инструкции: Используйте четкие, ориентированные на действие подсказки и условные решения для руководства агентами.
Ограждения: Безопасность слоя, актуальность и ограничения соответствия для обеспечения безопасного и предсказуемого поведения.
Человеческое вмешательство: Установите пороги и пути эскалации для случаев, которые требуют человеческого надзора.

Руководство подчеркивает начало малой и развивающейся сложности агента с течением времени-подход, повторяемый в недавно выпущенной демонстрации, которая показывает, как модульные, использующие инструменты могут быть организованы чисто.

Узнайте больше от Openai на VB Transform 2025

Команды, желающие перейти от прототипа к производству, будут более глубоко взглянуть на готовый к предприятию подход Openai во время Преобразование 2025организовано VentureBeat.

В настоящее время запланировано для Среда, 25 июня, в 15:10 PTсессия — подписано Год агентов: как Openai питает следующую волну интеллектуальной автоматизации— Установлена Olivier Godement, глава продукта для платформы API Openaiв разговоре со мной, Карл ФранзенВ Исполнительный редактор в VentureBeat.

20-минутный разговор будет охватывать:

Агентские шаблоны архитектуры: когда использовать отдельные петли, суб-агенты или оркестренные передачи.
Встроенные ограждения за регулируемые среды, включая политические отказы, регистрацию SOC-2 и поддержку резидентуры данных.
Стоимость/ROI-рычаги и тесты из полосы и коробки, в том числе на 35% более быстрое разрешение счетов и сортировку с нулевым сопротивлением.
Постижения в дорожной карте: что будет дальше для мультимодальных действий, памяти агента и оркестровки кросс-облака.

Независимо от того, экспериментируете ли вы с инструментами с открытым исходным кодом, такими как демонстрация агента по обслуживанию клиентов или масштабирующие агенты в критические рабочие процессы, эта сессия обещает заземленный взгляд на то, что работает, что следует избегать и что будет дальше.

Почему это важно для предприятий и разработчиков

Между недавно выпущенной демонстрацией и принципами, изложенными в Практическое руководство по строительным агентамOpenAI удваивает свою стратегию: позволяет разработчикам пройти мимо одного поворота LLM-приложений и к автономным системам, которые могут понимать контекст, разумно работать и работать безопасно.

Предлагая прозрачный инструмент и четкие примеры реализации, OpenAI выталкивает агентские системы из лаборатории и в повседневное использование — будь то обслуживание клиентов, операции или внутреннее управление. Для организаций, изучающих интеллектуальную автоматизацию, эти ресурсы обеспечивают не только вдохновение, но и рабочую пьесу.

Источник

Новости

Объявление о финалистах 2025 года для женщин в награде AI наград.

admin 19.06.2025

admin

Благодаря флагманскому событию Venturebeat, VB Transform, не за горами, мы рады объявить финалистов для 7 -й ежегодной премии Women in AI Awards. Победители будут объявлены во время специальной программы на главной стадии преобразования в среду, 25 июня, в 16:00 по тихоокеанскому времени.

VB Transform-главное двухдневное мероприятие 24-25 июня в Форт Мейсон в Сан-Франциско. Отраслевые эксперты и сверстники соберутся, чтобы предоставить всеобъемлющие идеи и лучшие практики о том, что на самом деле работает в Enterprise AI — от копирований до агентов. Участники будут иметь многочисленные возможности для создания значимых связей и расширить свои сети.

В рамках этого мероприятия Venturebeat будет чтить женщин-лидеров и изменений в ИИ во время личных сессий. Категории премий включают ответственность и этику ИИ, ИИ предпринимательство, исследование ИИ, наставничество ИИ и Rising Star.

Общественность представила кандидатов, и комитет VentureBeat выберет победителей. Критерии отбора включают приверженность кандидатам перед отрасли, усилия по повышению инклюзивности в этой области и их положительное влияние на сообщество.

Инвестирование в женщин в ИИ создаст более ценного ИИ, который лучше подходит для аудитории, и повысит рентабельность инвестиций для компаний. Воздействие никогда не было более ясным или более важным, и мы гордимся тем, что признаем лидеров в ИИ, которые оказывают влияние.

ИИ предприниматель: вывести ИИ из лаборатории в реальное мир

Эта награда будет чтить женщину, которая запустила компании, демонстрирующие большие обещания в ИИ. Рассмотрение будет уделено таким вещам, как бизнес -тяга, технологическое решение и влияние в пространстве искусственного интеллекта.

Элназ Сарраф, генеральный директор и основатель Roybi
Наталья Лопарева, генеральный директор и основатель Algorized
Оуафэ Карим, инженер и спонтер в Африке-эо-сервисах (AFEOS)
Франсса Васкес, вице -президент по профессиональным услугам и генеративным инновационным центром ИИ в AWS
Val Vacante SVP инновации решений в Dentsu

ИИ наставничество: Создание следующего поколения женщин в ИИ

Эта награда состоит в том, чтобы составить женского лидера, которая помогла наставлять других женщин в области искусственного интеллекта, обеспечивая руководство и поддержку и/или поощряя больше женщин к въезде в область ИИ.

Сандра Браун, заместитель главного советника в Softbank Robotics America, Inc.
Suruchi Shah, менеджер инженера, модельная команда, занимающаяся обслуживанием в LinkedIn
Parul Bhandari, Global Head Telco, Стратегия Media и Gaming Partner в Microsoft
Reut Lazo, основатель Women X AI
Николь Кариганен, SVP Security и стратегия искусственного интеллекта, Field Ciso, в Darktrace

Исследование ИИ: подпитывание следующей волны преобразующего ИИ

Эта награда будет соблюдать женщину, которая оказала значительное влияние на область исследований в области искусственного интеллекта, помогая ускорить прогресс либо в ее организации, в рамках академических исследований или влияния на ИИ.

Линдсей Ричман, генеральный директор Innerverse AI
Payel Das, основной научный сотрудник и менеджер по IBM Research — TJ Watson Research Center
Сума Кумарасвами, старший директор, руководитель OMB Digital Products Innovation в First Tech Federal Credit Union
Энн Ирвин, главный сотрудник по данным и аналитике в Resilience
Ханнане Хаджисирзи, старший директор NLP в AI2; Асцентрат семьи Тороде в Школе компьютерных наук и инженерии Аллена в Университете Вашингтона в Институте искусственного интеллекта Аллена (AI2); и Вашингтонский университет

Ответственность и этика ИИ: вдумчиво построение ИИ, которое приводит к лучшему и более справедливому миру

Эта награда будет соблюдать женщину, которая демонстрирует образцовое лидерство и прогресс в растущей горячей теме ответственного ИИ.

Алисия Шапиро, директор по директору, начальник отдела новостей на ainews.com
Дениз Терли, вице -президент по технологиям, данным и ИИ, Торговая палата США
Sakshi Kiran Naik, инженер AI/ML в Walgreens Boots Alliance
Стефани Коэн, директор по стратегии в Cloudflare
Эдвина Фицмаурис, лидер активации мирового рынка в EY

Rising Star: честь женщин на ранних этапах их карьеры, которые демонстрируют это «что -то особенное»

Эта награда будет чтить женщину на начальном этапе ее карьеры ИИ, которая продемонстрировала образцовые черты лидерства.

Арина Власова, генеральный директор Datagpt
Minista Jazz, генеральный директор Mar Tround
Наталья Родригес, вице -президент по персоналу в Bairesdev
Рита Козлов, вице -президент, продукт для разработчиков и ИИ в Cloudflare
Сесилия Шен, генеральный директор и соучредитель в Cybever, Inc.

Мы хотели бы поздравить всех женщин, которые были номинированы, чтобы получить награду женщин в AI. Спасибо всем за их номинации и за то, что они способствовали растущему осознанию женщин, которые имеют существенное значение в ИИ.

Источник

Новости

От быстрого хаоса до ясности: как построить надежный слой оркестровки ИИ

admin 19.06.2025

admin

Примечание редактора: Эмилия возглавит редакционный круглый стол на этой теме на VB Transform на следующей неделе. Зарегистрируйтесь сегодня.

В наши дни агенты ИИ кажутся неизбежностью. Большинство предприятий уже используют приложение ИИ и, возможно, развернули хотя бы одну агентную систему с планами по пилотированию рабочих процессов с несколькими агентами.

Управление всем этим растягиванием, особенно при попытке построить совместимость в долгосрочной перспективе, может стать ошеломляющим. Достижение этого агента будущего означает создание работоспособной структуры оркестровки, которая направляет различных агентов.

Спрос на приложения и оркестровку искусственного интеллекта привел к появлению нового поля битвы, причем компании были сосредоточены на предоставлении плат -цепочек и инструментов, получая клиентов. Теперь предприятия могут выбирать между поставщиками фреймвортов оркестровки, такими как Langchain, Lmamaindex, Crew AI, Microsoft Autogen и Speenai’s Swarm.

Предприятия также должны рассмотреть тип структуры оркестровки, которую они хотят реализовать. Они могут выбирать между быстрого на основе структуры, ориентированных на агентом двигателей рабочих процессов, поиска и индексированных рамок или даже сквозной оркестровки.

Поскольку многие организации только начинают экспериментировать с несколькими системами агентов ИИ или хотят создать более крупную экосистему ИИ, конкретные критерии находятся на вершине их ума при выборе структуры оркестровки, которая наилучшим образом соответствует их потребностям.

Этот больший пул вариантов в оркестровке продвигает пространство еще дальше, поощряя предприятия изучать все потенциальные выборы для организации своих систем ИИ вместо того, чтобы заставлять их вписаться во что -то другое. Несмотря на то, что это может показаться ошеломляющим, у организаций есть способ взглянуть на лучшие практики в выборе структуры оркестровки и выяснить, что хорошо для них работает.

Платформа оркестровки Орк, отмеченная в сообщении в блоге, что системы управления искусственным интеллектом включают в себя четыре ключевых компонента: быстрое управление для последовательного взаимодействия модели, инструменты интеграции, управление состоянием и инструменты мониторинга для отслеживания производительности.

Лучшие практики для рассмотрения

Для предприятий, планирующих отправиться в свое путешествие по оркестровке или улучшить их нынешние, некоторые эксперты из таких компаний, как Teneo и Orq, отмечают как минимум пять лучших практик для начала.

Определите свои бизнес -цели
Выберите инструменты и большие языковые модели (LLM), которые соответствуют вашим целям
Выложите то, что вам нужно, от слоя оркестровки, и расставить приоритеты, т.е., интеграция, проектирование рабочего процесса, мониторинг и наблюдение, масштабируемость, безопасность и соответствие требованиям
Знайте свои существующие системы и как интегрировать их в новый слой
Поймите свой конвейер данных

Как и в случае с любым проектом искусственного интеллекта, организации должны брать реплики от потребностей своего бизнеса. Что им нужно делать приложение или агенты ИИ, и как они планируются поддерживать свою работу? Начиная с этого ключевого шага поможет лучше информировать их потребности в оркестровке и тип необходимых им инструментов.

Тенео сказал в сообщении в блоге, что, как только это станет ясно, команды должны знать, что им нужно из своей системы оркестровки, и убедиться, что это первые функции, которые они ищут. Некоторые предприятия могут захотеть больше сосредоточиться на мониторинге и наблюдении, а не на конструкции рабочего процесса. Как правило, большинство фреймворков оркестровки предлагают ряд функций, и компоненты, такие как интеграция, рабочий процесс, мониторинг, масштабируемость и безопасность, часто являются главными приоритетами для предприятий. Понимание того, что важнее всего для организации, будет лучше направлять, как они хотят создать свой слой оркестровки.

В сообщении в блоге Лангхейн заявил, что предприятия должны знать, какая информация или работа передается моделям.

«При использовании структуры вам необходимо полное контроль над тем, что передается в LLM, и полный контроль над тем, какие шаги выполняются и в каком порядке (для создания контекста, который передается в LLM). Мы расставляем приоритеты с помощью Langgraph, которая представляет собой низкоуровневую структуру оркестровки, не приспособленные к контексту, не принуждающуюся к тому, что вы не вымощите, что вам нужно, что это нужно.

Поскольку большинство предприятий планируют добавить агентов искусственного интеллекта в существующие рабочие процессы, лучше всего знать, какие системы должны быть частью стека оркестровки и найти платформу, которая лучше всего интегрирует.

Как всегда, предприятия должны знать свой конвейер данных, чтобы они могли сравнить производительность агентов, которые они контролируют.

Источник

Новости

Мираж контроля: конфиденциальность в эпоху агентского ИИ

admin 18.06.2025

admin

Представлено Zscaler

Мы думали о конфиденциальности как о проблеме по периметру: о стенах и замках, разрешениях и политике. Но в мире, где искусственные агенты становятся автономными субъектами — взаимодействуют с данными, системами и людьми без постоянного надзора — конфиденциальность больше не касается контроля. Это о доверии. И доверие, по определению, о том, что происходит, когда вы не смотрите.

Агент ИИ — ИИ, который воспринимает, решает и действует от имени других — больше не теоретический. Это маршрутизация нашего трафика, рекомендации наших методов лечения, управление нашими портфелями и переговоры о нашей цифровой идентичности на всех платформах. Эти агенты не просто обрабатывают конфиденциальные данные — они интерпретируют их. Они делают предположения, действуют на частичные сигналы и развиваются на основе циклов обратной связи. По сути, они строят внутренние модели не только мира, но и из нас.

И это должно дать нам паузу.

Потому что, как только агент становится адаптивным и полуавтономным, конфиденциальность не только о том, кто имеет доступ к данным; Речь идет о том, что агент делает, что он выбирает, чтобы делиться, подавлять или синтезировать, и остаются ли его цели с нашими целями, когда контексты сдвигаются.

Возьмите простой пример: AI Health Assistant, предназначенный для оптимизации здоровья. Это начинается с того, что подталкивает вас, чтобы выпить больше воды и выспаться. Но со временем он начинает уделять ваше назначение, анализируя ваш тон голоса на предмет признаков депрессии, и даже удержание уведомлений, которые, как предсказывают, это вызовет стресс. Вы не просто поделились своими данными — вы уступили повествовательной власти. Вот где конфиденциальность разрывается не через нарушение, а через тонкий дрейф в силе и цели.

Это больше не просто конфиденциальность, целостность и доступность, классическая триада ЦРУ. Теперь мы должны учитывать подлинность (можно ли проверить этот агент как сам?) И правдивости (можем ли мы доверять его интерпретациям и представлениям?). Это не просто технические качества — они доверяют примитивам.

И доверие является хрупким при промежуточном интеллекте.

Если я доверяю человеческому терапевту или адвокату, есть предполагаемые границы — этические, юридические, психологические. Мы ожидали норм поведения с их стороны и ограниченного доступа и контроля. Но когда я делюсь с помощником ИИ, эти границы размываются. Можно ли это быть внесено в суд? Проверяется? Обратно инженерный? Что происходит, когда правительство или корпорация запрашивает моего агента на его записи?

У нас нет урегулированной концепции привилегии AI-клиента. И если юриспруденция обнаружит, что его нет, то все, что мы доверяем нашим агентам, становится ретроспективным сожалением. Представьте себе мир, в котором каждый интимный момент, разделяемый с ИИ, является юридически обнаруженным — где память вашего агента становится вооруженным архивом, допустимым в суде.

Не имеет значения, насколько безопасна система, если социальный договор вокруг нее сломается.

Сегодняшние структуры конфиденциальности — GDPR, CCPA — предполагают линейные транзакционные системы. Но агент AI работает в контексте, а не только вычислении. Это помнит, что вы забыли. Это интуиция того, что вы не сказали. Он заполняет пробелы, которые могут быть ни одним из его бизнеса, а затем делится этим синтезом — потенциально полезно, потенциально безрассудным — с системами и людьми, находящимися за пределами вашего контроля.

Таким образом, мы должны выходить за рамки контроля доступа и к этическим границам. Это означает создание агентских систем, которые понимают намерение конфиденциальности, а не только механики. Мы должны спроектировать для разборчивости; ИИ должен быть в состоянии объяснить, почему он действовал. И для интенциональности. Он должен быть в состоянии действовать таким образом, что отражает развивающиеся значения пользователя, а не просто замороженную историю быстрого подсказки.

Но нам также нужно бороться с новым видом хрупкости: что, если мой агент предает меня? Не из злобы, а потому, что кто -то другой создал лучшие стимулы — или принял закон, который заменил его лояльность?

Короче говоря: что, если агент как мой, так и не мой?

Вот почему мы должны начать рассматривать агентство ИИ как моральную и правовую категорию первого порядка. Не как функция продукта. Не как пользовательский интерфейс. Но как участник социальной и институциональной жизни. Потому что конфиденциальность в мире ума — биологическая и синтетическая — больше не является вопросом секретности. Это вопрос взаимности, выравнивания и управления.

Если мы пойдем это неправильно, конфиденциальность станет перформативной — флажок в теневой игре прав. Если мы сделаем это правильно, мы строим мир, в котором автономия, как человеческая, так и машина, регулируется не путем наблюдения или подавления, а этической когерентностью.

Агент ИИ заставляет нас противостоять пределам политики, ошибки контроля и необходимости нового общественного договора. Один построен для сущностей, которые думают — и тот, который обладает силой, чтобы выжить, когда они говорят.

Сэм Карри — это глобальный вице -президент, CISO в резиденции в Zscaler.

Спонсируемые статьи — это контент, производимый компанией, которая либо платит за пост, либо имеет деловые отношения с VentureBeat, и они всегда четко обозначены. Для получения дополнительной информации свяжитесь с sales@venturebeat.com.

Источник

Новости

Интерпретируемая пьеса ИИ: что исследование Anpropic означает для вашей стратегии Enterprise LLM

admin 18.06.2025

admin

В апреле генеральный директор Anpropic Дарио Амодеей сделал срочный толчок в апреле, чтобы понять, как думают модели ИИ.

Это происходит в решающее время. Как антропные сражения в глобальном рейтинге ИИ, важно отметить, что отличает его от других лучших лабораторий искусственного интеллекта. С момента своего основания в 2021 году, когда семь сотрудников Openai разорвались из-за опасений по поводу безопасности искусственного интеллекта, Anpropic создал модели ИИ, которые придерживаются ряда ценных принципов, которые они называют конституционным ИИ. Эти принципы гарантируют, что модели «полезны, честны и безвредны» и, как правило, действуют в интересах общества. В то же время исследовательская рука Антропика глубоко погружается, чтобы понять, как его модели думают о мире, и почему Они производят полезные (а иногда и вредные) ответы.

Флагманская модель Anpropic, Claude 3.7 Sonnet, доминировала в кодирующих критериях кодирования при запуске в феврале, доказывая, что модели искусственного интеллекта могут преуспеть как при производительности, так и при безопасности. А недавний выпуск Opus и Sonnet Claude 4.0 снова ставит Клода на вершину кодирования. Тем не менее, на сегодняшнем быстром и гиперконкурентном рынке ИИ у конкурентов Anpropic, таких как Google Gemini 2.5 Pro и Open AI O3, есть свои впечатляющие показы для исчерпывания кодирования, в то время как они уже доминируют в Claude по математике, творческому письму и общей рассуждениях на многих языках.

Если мысли Amodei являются какими -либо показателями, Anpropic планирует будущее ИИ и его последствия в критических областях, таких как медицина, психология и право, где безопасность модели и человеческие ценности являются обязательными. И это показывает: «Антропическая лаборатория» — это ведущая лаборатория ИИ, которая строго фокусируется на разработке «интерпретируемого» ИИ, который является моделями, которые давайте понимают, с некоторой степени уверенности, что думает модель и как она приходит к конкретному выводу.

Amazon и Google уже инвестировали миллиарды долларов в антроповые, даже несмотря на то, что они создают свои собственные модели ИИ, поэтому, возможно, конкурентное преимущество Anpropic все еще начинается. Интерпретируемые модели, как предполагает антропно, могут значительно снизить долгосрочные эксплуатационные затраты, связанные с отладкой, аудитом и смягчением рисков в сложных развертываниях ИИ.

Sayash Kapoor, исследователь безопасности ИИ, предполагает, что, хотя интерпретируемость ценна, это лишь один из многих инструментов для управления риском ИИ. По его мнению, «интерпретируемость не является ни необходимой, ни достаточной», чтобы гарантировать, что модели ведут себя безопасно-это наиболее важно в сочетании с фильтрами, верификаторами и ориентированным на человека дизайна. В этом более обширном взгляде рассматривается интерпретируемость как часть более крупной экосистемы стратегий управления, особенно в реальных развертываниях ИИ, где модели являются компонентами в более широких системах принятия решений.

Необходимость интерпретируемого ИИ

До недавнего времени многие думали, что ИИ все еще были годами от достижений, подобных тем, которые сейчас помогают Клоду, Близнецам и Чэтгпту могут похвастаться исключительным принятием рынка. Хотя эти модели уже продвигают границы человеческих знаний, их широкое использование связано с тем, насколько они хороши в решении широкого спектра практических проблем, которые требуют творческого решения проблем или подробного анализа. Поскольку модели ставят в задачу на все более важные проблемы, важно, чтобы они давали точные ответы.

Амодеей опасается, что когда ИИ отвечает на подсказку, «мы понятия не имеем… почему он выбирает определенные слова над другими, или почему он иногда совершает ошибку, несмотря на то, что обычно точнее». Такие ошибки — галлюцинации неточной информации или ответы, которые не соответствуют человеческим ценностям, — будут удерживать модели ИИ от полного их потенциала. Действительно, мы видели много примеров того, как ИИ продолжает бороться с галлюцинациями и неэтичным поведением.

Для Amodei лучший способ решить эти проблемы — это понять, как думает ИИ: «Наша неспособность понимать внутренние механизмы моделей означает, что мы не можем осмысленно предсказать такое (вредное) поведение и поэтому изо всех сил пытаются исключить их… если бы вместо этого это было возможно заглянуть внутрь моделей, мы могли бы систематически блокировать все джейл -брейки, а также характеризовать то, что имеют опасные знания, которые обладают модели».

Amodei также рассматривает непрозрачность текущих моделей как барьер для развертывания моделей ИИ в «финансовых или критических условиях безопасности, потому что мы не можем полностью установить ограничения на их поведение, и небольшое количество ошибок может быть очень вредным». В принятии решений, которое влияет на людей напрямую, например, медицинская диагностика или оценка ипотеки, юридические правила требуют, чтобы ИИ объяснял его решения.

Представьте себе финансовое учреждение, использующее большую языковую модель (LLM) для обнаружения мошенничества — интерпретация может означать объяснение заявления о запрещении заявления о кредите клиенту в соответствии с требованиями закона. Или производственная фирма, оптимизирующая цепочки поставок — понимание того, почему ИИ предполагает, что конкретный поставщик может разблокировать эффективность и предотвратить непредвиденные узкие места.

Из -за этого, объясняет Амодеей: «Антропик удваивает интерпретируемость, и у нас есть цель — добраться до« интерпретации может надежно обнаружить большинство модельных проблем »к 2027 году».

С этой целью Антропик недавно участвовал в инвестициях в $ 50 миллионов в GoodFire, исследовательской лаборатории искусственного интеллекта, совершившего прорыв на «Сканирование мозга». Их модельная платформа проверки, Ember, является агностическим инструментом, который определяет изученные концепции в моделях и позволяет пользователям манипулировать ими. В недавней демонстрации компания показала, как Ember может распознавать отдельные визуальные концепции в области искусственного интеллекта, а затем позволить пользователям краска Эти концепции на холсте для генерации новых изображений, которые следуют за дизайном пользователя.

Инвестиции Anpropic в Ember намекают на тот факт, что разработка интерпретируемых моделей достаточно затруднена, что у Anpropic нет рабочей силы для самостоятельной достижения. Творческие интерпретируемые модели требуют новых инструментов и квалифицированных разработчиков для их создания

Более широкий контекст: перспектива исследователя ИИ

Чтобы сломать перспективу Амодея и добавить столь необходимый контекст, Venturebeat взял интервью у Kapoor, исследователю безопасности ИИ в Принстоне. Капур соавторил книгу Ай змеиное маслокритическое исследование преувеличенных претензий, связанных с возможностями ведущих моделей ИИ. Он также является соавтором «ИИ как обычная технологияВ котором он выступает за то, чтобы рассматривать ИИ как стандартный трансформационный инструмент, такой как Интернет или электричество, и способствует реалистичной перспективе его интеграции в повседневные системы.

Капур не оспаривает, что интерпретируемость является ценной. Тем не менее, он скептически относится к этому как к центральному столпу выравнивания ИИ. «Это не серебряная пуля», — сказал Капур VentureBeat. По его словам, многие из наиболее эффективных методов безопасности, такие как фильтрация после ответа, вообще не требуют открытия модели.

Он также предупреждает о том, что исследователи называют «ошибкой непостижимости» — идеей, что, если мы не до конца понимаем внутренние внутренности системы, мы не можем использовать или регулировать ее ответственно. На практике полная прозрачность — это не то, как оценивается большинство технологий. Важно то, выполняет ли система надежно в реальных условиях.

Это не первый раз, когда Amodei предупреждает о рисках ИИ, опережая наше понимание. В своем посте в октябре 2024 года «Машины любящей благодати» он набросал видение все более способных моделей, которые могут предпринять значимые действия реального мира (и, возможно, удвоить нашу жизнь).

По словам Капура, здесь есть важное различие между моделью способность и это властьПолем Модельные возможности, несомненно, быстро растут, и вскоре они могут разработать достаточно интеллекта, чтобы найти решения для многих сложных проблем, оспаривающих человечество сегодня. Но модель так же мощна, как и интерфейсы, которые мы предоставляем ее для взаимодействия с реальным миром, в том числе где и как развертываются модели.

Amodei отдельно утверждал, что США должны поддерживать лидерство в разработке ИИ, частично через экспортные элементы управления, которые ограничивают доступ к мощным моделям. Идея состоит в том, что авторитарные правительства могут использовать системы пограничного искусственного интеллекта безответственно — или захватить геополитическое и экономическое преимущество, которое связано с их развертыванием в первую очередь.

Для Капура «даже самые большие сторонники экспортного контроля согласны с тем, что он даст нам не более года или два». Он думает, что мы должны рассматривать ИИ как «нормальную технологию», как электричество или Интернет. Несмотря на революционную, потребовалось десятилетия, чтобы обе технологии были полностью реализованы во всем обществе. Капур считает, что это то же самое для ИИ: лучший способ поддерживать геополитическое преимущество — сосредоточиться на «длинной игре» трансформирующих отраслей промышленности для эффективного использования ИИ.

Другие критикуют амодеей

Капур не единственный, кто критикует позицию Амодея. На прошлой неделе в Vivatech в Париже Янсен Хуанг, генеральный директор Nvidia, объявил о своем несогласии с взглядами Амодея. Хуан расспросил, должен ли власть развивать ИИ ограничивать несколько влиятельных сущностей, таких как Антроп. Он сказал: «Если вы хотите, чтобы все делалось безопасно и ответственно, вы делаете это на открытом воздухе… не делайте этого в темной комнате и не говорите мне, что это безопасно».

В ответ Антропик заявил: «Дарио никогда не утверждал, что« только «только антроп» может построить безопасный и мощный ИИ. Как покажет публичный отчет, Дарио выступал за национальный стандарт прозрачности для разработчиков ИИ (включая антроп), чтобы общественные и политики знали о способностях и рисках моделей и могут подготовить соответствующую ».

Стоит также отметить, что Anpropic не одинока в своем стремлении к интерпретации: команда Google по интерпретации DeepMind, возглавляемая Нил Нандой, также внесла серьезный вклад в исследования интерпретации.

В конечном счете, лучшие лаборатории и исследователи ИИ предоставляют убедительные доказательства того, что интерпретация может быть ключевым отличием на конкурентном рынке ИИ. Предприятия, которые приоритет интерпретируемости на ранней стадии может получить значительное конкурентное преимущество, создавая более надежные, совместимые и адаптируемые системы ИИ.

Источник

Новости

OpenAI продвигается вперед с помощью GPT-4.5 в API, вызывая страдания и путаницы разработчика.

admin 18.06.2025

admin

Слово быстро распространилось по всему машинному обучению и сообществу искусственного интеллекта в социальной сети X вчера: OpenAI посылал разработчикам электронное письмо, уведомляющее их о том, что компания удалит одну из своих крупнейших и самых мощных моделей крупных языков (LLMS), предварительный просмотр GPT-4.5 из официального интерфейса приложений OpenAI (API), GPT-4.5, из официального интерфейса приложений OpenAI (API), GPT-4.5, из официального интерфейса приложений OpenAI (API), GPT-4.5, из официального интерфейса приложений OpenAI (API), GPT-4.5, из официального интерфейса приложений OpenAI (API), GPT-4.5. 14 июля 2025 года.

Тем не менее, как сообщил представитель OpenAI VentureBeat по электронной почте, предварительный просмотр GPT-4.5 останется вариантом для отдельных пользователей CHATGPT через меню выпадающих моделей в верхней части приложения.

Но это означает, что любые сторонние разработчики, которые создали приложения или рабочие процессы на вершине предварительного просмотра GPT-4.5 (мы назовут это GPT-4.5 с этого момента для простоты, так как полный GPT-4.5 никогда не был доступен на этой платформе), теперь необходимо переключиться на другой из почти 40 (!!!), все еще доступные через API.

Новости быстро распространились на X, где разработчики и энтузиасты искусственного интеллекта опубликовали реакции, начиная от разочарования до путаницы.

Некоторые описали GPT-4.5 как ежедневный инструмент в своем рабочем процессе, восхваляя его тон и надежность. Другие поставили под сомнение обоснование запуска модели в первую очередь, если она будет недолгим.

«Это печально-GPT-4.5-одна из моих любимых моделей»,-написал @bumrahbachi.

Бен Хайак, соучредитель AI Observicability and Performance Platform Raindrop.ai, названный «трагическим», добавляя: «O3 + 4.5-это модели, которые я использую больше всего каждый день».

Другой пользователь, @flowersslop, прямо спросил: «Какова была цель этой модели все время?»

Унимок был спланирован с апреля

Несмотря на сильную реакцию, OpenAI фактически уже объявил о плане оправдать предварительный просмотр GPT-4.5 еще в апреле 2025 года во время запуска GPT-4.1.

В то время компания заявила, что у разработчиков будет три месяца, чтобы перейти от 4,5. Openai сформулировал модель как экспериментальное предложение, которое дало представление о будущем развитии, и заявила, что она будет перенести знания от GPT-4.5 в будущие итерации-особенно в таких областях, как творчество и написание нюансов.

В последующем ответе на VentureBeat Openai Communications подтвердила, что июньское электронное письмо было просто запланированным напоминанием и что в настоящее время не планирует удалить GPT-4.5 из подписок CHATGPT, где модель остается доступной.

Предположения сообщества о стратегии затрат и моделей

Тем не менее, смягченная разработчиком искажает пробел для некоторых пользователей, особенно тех, кто создал рабочие процессы или продукты вокруг конкретных характеристик GPT-4.5.

Некоторые в сообществе предполагали, что высокие расчеты могли повлиять на ход, отметив, что аналогичные изменения произошли с предыдущими моделями.

Другие ссылались на недавние обновления цен на API, в том числе значительное снижение стоимости GPT-3.5 (внутренне называемая O3), что в настоящее время оценивается на 80% ниже, чем раньше.

User @Chatgpt21 прокомментировал, что GPT-4.5 является «лучшей моделью без рассуждений для Open AI на всех критериях и это очевидно», и предсказано, что OpenAI «они добавят время теста, вычислить его взорвать O3. Чтобы масштабировать TTC вам необходимо масштабировать

Конец дороги для GPT-4.5 через API-разработчики поощрялись мигрировать в GPT-4.1

OpenAI направил разработчиков на свой онлайн-форум на вопросы о переходе на GPT-4.1 или другие модели. С закрытием API для предварительного просмотра GPT-4.5 для середины июля, команды, полагаемые на модель, теперь имеют менее месяца для завершения этого перехода.

Источник

Новости

Резка облачных отходов в масштабе: Akamai экономит 70%, используя агенты искусственного интеллекта, организованные Kubernetes

admin 17.06.2025

admin

В частности, в эту зажатую эру генеративного ИИ, облачные затраты находятся на рекордно высоком уровне. Но это не только потому, что предприятия используют больше вычислений — они не используют его эффективно. На самом деле, только в этом году предприятия должны тратить 44,5 миллиарда долларов на ненужные расходы на облачные.

Это усиленная проблема для Akamai Technologies: компания имеет большую и сложную облачную инфраструктуру на нескольких облаках, не говоря уже о многочисленных строгих требованиях безопасности.

К Решить это, поставщик кибербезопасности и доставки контента обратился к платформе автоматизации Kubernetes Cast AI, чьи агенты искусственного интеллекта помогают оптимизировать стоимость, безопасность и скорость в облачных средах.

В конечном счете, платформа помогла Akamai сократить от 40% до 70% облачных затрат, в зависимости от рабочей нагрузки.

«Нам нужен был постоянный способ оптимизировать нашу инфраструктуру и сократить наши облачные затраты, не жертвуя производительностью», — сказал VentureBeat, Dekel Shavit, старший директор Cloud Engineering в Akamai. «Мы те, которые обрабатывают события безопасности. Задержка не вариант. Если мы не можем ответить на атаку безопасности в режиме реального времени, мы потерпели неудачу».

Специализированные агенты, которые контролируют, анализируют и действуют

Kubernetes управляет инфраструктурой, которая запускает приложения, облегчая развертывание, масштабирование и управление ими, особенно в облачных коренных и микросервисах.

Cast AI интегрировался в экосистему Kubernetes, чтобы помочь клиентам масштабировать свои кластеры и рабочие нагрузки, выбрать лучшую инфраструктуру и управлять вычислительными жизненными циклами, объяснил основатель и генеральный директор Лоурента Гила. Его основной платформой является автоматизация производительности приложений (APA), которая работает через команду специализированных агентов, которые постоянно контролируют, анализируют и предпринимают действия для повышения производительности, безопасности, эффективности и стоимости приложений. Компании предоставляют только то, что им нужно от AWS, Microsoft, Google или других.

APA оснащена несколькими моделями машинного обучения (ML) с обучением подкрепления (RL) на основе исторических данных и изученных моделей, улучшенных стеком наблюдений и эвристики. Он в сочетании с инструментами инфраструктуры как кода (IAC) на нескольких облаках, что делает его полностью автоматизированной платформой.

Гил объяснил, что APA была построена на принципе, что наблюдаемость является лишь отправной точкой; Как он назвал это, наблюдаемость — это «фундамент, а не цель». Cast AI также поддерживает постепенное внедрение, поэтому клиентам не нужно вырывать и заменять; Они могут интегрироваться в существующие инструменты и рабочие процессы. Кроме того, ничто никогда не оставляет инфраструктуры клиента; Весь анализ и действия происходят в их выделенных кластерах Kubernetes, обеспечивая большую безопасность и контроль.

Гил также подчеркнул важность ориентированности на человека. «Автоматизация дополняет процесс принятия решений человеком»,-сказал он, а APA поддерживает рабочие процессы человека в среднем уровне.

Уникальные проблемы Акамай

Шавит объяснил, что крупная и сложная облачная инфраструктура Akamai и услуги по предоставлению кибербезопасности и услуги кибербезопасности, предоставляемые «некоторым из самых требовательных клиентов и отраслей в мире», в соответствии со строгими соглашениями об уровне обслуживания (SLA) и требованиях к производительности.

Он отметил, что для некоторых услуг, которые они потребляют, они, вероятно, являются крупнейшими клиентами для своего поставщика, добавив, что они сделали «тонны основного инженера и реинжиниринг» со своим гиперскладером в соответствии с их потребностями.

Кроме того, Akamai обслуживает клиентов различных размеров и отраслей, включая крупные финансовые учреждения и компании по кредитным картам. Услуги компании напрямую связаны с осанкой ее клиентов.

В конечном счете, Акамаи нужно было сбалансировать всю эту сложность с стоимостью. Шавит отметил, что реальные атаки на клиентов могут способствовать емкости в 100 раз или 1000x на определенные компоненты своей инфраструктуры. Но «масштабирование нашей облачной емкости в 1000 раз заранее просто невозможнее», — сказал он.

Его команда рассмотрела оптимизацию на кодовой стороне, но неотъемлемая сложность их бизнес -модели требовала сосредоточения внимания на самой основной инфраструктуре.

Автоматически оптимизация всей инфраструктуры Kubernetes

Акамай действительно нуждалась в платформе автоматизации Kubernetes, которая могла бы оптимизировать затраты на запуск всей своей основной инфраструктуры в режиме реального времени на нескольких облаках, объяснил Шавит и масштабируйте приложения вверх и вниз, основываясь на постоянно меняющемся спросе. Но все это должно было быть сделано без жертвоприношения применения.

Прежде чем внедрить актерский состав, Шавит отметил, что команда Devops Akamai вручную настроила все свои рабочие нагрузки Kubernetes всего несколько раз в месяц. Учитывая масштаб и сложность его инфраструктуры, она была сложной и дорогостоящей. Только анализируя рабочие нагрузки спорадически, они явно упустили любой потенциал оптимизации в реальном времени.

«Теперь сотни актеров делают одну и ту же настройку, за исключением того, что они делают это каждую секунду каждого дня», — сказал Шавит.

Основными характеристиками APA используются Akamai, которые являются автоматической автоматизацией Kubernetes с упаковкой бин (минимизация количества используемых бункеров), автоматический выбор наиболее экономически эффективных вычислительных экземпляров, правонарушения рабочей нагрузки, автоматизации экций на протяжении всего жизненного цикла экземпляра и анализа затрат.

«Мы получили представление об аналитике затрат через две минуты после интеграции, чего мы никогда раньше не видели», — сказал Шавит. «После того, как активные агенты были развернуты, оптимизация включена автоматически, и сбережения начали появляться».

Точечные экземпляры — где предприятия могут получить доступ к неиспользованной облачной способности по дисконтированным ценам — очевидно, имело деловой смысл, но они оказались сложными из -за сложных рабочих нагрузок Акамай, особенно Apache Spark, отметил Шавит. Это означало, что им нужно было либо превышать рабочие нагрузки, либо приложить на них больше рабочих рук, что оказалось финансово нелогичным.

С актерским искусственным искусством они смогли использовать точечные экземпляры на Spark с «нулевыми инвестициями» от инженерной группы или операций. Ценность точечных экземпляров была «супер ясной»; Им просто нужно было найти подходящий инструмент, чтобы иметь возможность их использовать. Это была одна из причин, по которой они продвинулись вперед с актером, отметил Шавит.

При сохранении 2x или 3 раза в их облачном счете великолепно, Шавит отметил, что автоматизация без ручного вмешательства «бесценна». Это привело к «массивной» экономии времени.

Прежде чем внедрить Cast AI, его команда «постоянно перемещалась по ручкам и переключателям», чтобы гарантировать, что их производственные среды и клиенты соответствуют услуге, в которую они нуждались для инвестирования.

«Вручную самым большим преимуществом был тот факт, что нам больше не нужно управлять нашей инфраструктурой», — сказал Шавит. «Команда агентов CAST сейчас делает это для нас. Это освободило нашу команду, чтобы сосредоточиться на том, что больше всего важно: быстрее выпуска функций для наших клиентов».

Примечание редактора: в этом месяце VB Transform Google Cloud CTO Уилл Граннис и Highmark Health SVP и директор по аналитике Ричард Кларк обсудит новый стек ИИ в здравоохранении и реальные проблемы развертывания многомодельных систем ИИ в сложной, регулируемой среде. Зарегистрируйтесь сегодня.

Источник

Новости

Minimax-M1-новая модель с открытым исходным кодом с 1 миллионами токеновых контекста и новым гиперэффективным обучением подкреплению

admin 17.06.2025

admin

Китайский AI Startup Minimax, возможно, наиболее известный на Западе за свою реалистичную видео-модель AI Hailuo, выпустила свою новейшую модель большого языка, Minimax-M1-и в отличных новостях для предприятий и разработчиков, она полностью открыта по лицензии Apache 2.0, а это означает, что предприятия могут принять его и использовать его для коммерческих приложений и изменять его в симпатию без ограничения или оплаты.

M1-это предложение с открытым весом, которое устанавливает новые стандарты в рассуждениях о длинном контексте, использовании агента и эффективной производительности вычислительной работы. Он доступен сегодня в сообществе сообщества, обнимающего обнимание Code Code Code, и конкурирующее сообщество Microsoft Community Github, первое выпуск того, что компания назвала «Minimaxweek» из своего социального аккаунта на X — с ожидаемыми дальнейшими объявлениями о продукте.

Minimax-M1 отличается контекстным окном в 1 миллион входных токенов и до 80 000 токенов в выводе, позиционируя его как одну из самых экспансивных моделей, доступных для задач рассуждения с длинным контекстом.

«Контекстное окно» в моделях крупных языков (LLMS) относится к максимальному количеству токенов, которые модель может обрабатывать за один раз, включая как вход, так и вывод. Токены являются основными единицами текста, которые могут включать в себя целые слова, части слов, знаки препинания или символы кода. Эти токены преобразуются в численные векторы, которые модель использует для представления и манипулирования значением с помощью своих параметров (веса и смещения). По сути, это родной язык LLM.

Для сравнения, GPT-4O OpenAI имеет контекстное окно составляет всего 128 000 токенов-достаточно, чтобы обмениваться информацией о романе между пользователем и моделью в одном взаимодействии вперед и назад. На 1 миллион токена, Minimax-M1 может обменять небольшой коллекция или информация о ценности книг. Google Gemini 2.5 Pro предлагает верхний предел контекста токена в 1 млн. 1 млн., Со вкладом сообщается о 2 миллионах окна.

Но у M1 есть еще один трюк в рукаве: он был обучен с использованием обучения подкреплению по инновационной, изобретательной, высокоэффективной технике. Модель обучается с использованием архитектуры гибридной смеси экспертов (MOE) с механизмом внимания молнии, предназначенным для снижения затрат на вывод.

Согласно техническому отчету, Minimax-M1 потребляет только 25% от операций с плавающей запятой (провалов), требуемых DeepSeek R1 с длиной поколения 100 000 токенов.

Архитектура и варианты

Модель поставляется в двух вариантах-Minimax-M1-40K и Minimax-M1-80K-обрабатывая их «бюджеты мышления» или длину выхода.

Архитектура построена на более раннем фонде компании Minimax-Text-01 и включает в себя 456 миллиардов параметров, с 45,9 млрд. Активированных на токен.

Выдающейся особенностью релиза является стоимость обучения модели. Minimax сообщает, что модель M1 была обучена с использованием крупномасштабного обучения подкреплению (RL) с эффективностью, редко наблюдаемой в этом домене, общая стоимость 534 700 долларов США.

Эта эффективность приписывается пользовательскому алгоритму RL под названием CISPO, который зажигает важность выборки веса, а не обновления токенов, а также гибридную конструкцию внимания, которая помогает оптимизировать масштабирование.

Это удивительно «дешевая» сумма для Frontier LLM, так как Deepseek обучил свою популярную модель рассуждений R1 по сообщению о стоимости 5-6 миллионов долларов, в то время как стоимость обучения GPT-4 Openais-более чем двухлетняя модель, которая сейчас превысила 100 миллионов долларов. Эта стоимость поступает как цены на графическую обработку (графические графические процессоры), массивно параллельное оборудование для вычислений, в основном производимые такими компаниями, как Nvidia, которое может стоить 20 000–30 000 долл. США или более на модуль, а также от энергии, необходимой для постоянного запуска этих чипов в крупномасштабных центрах обработки данных.

Эталонная производительность

Minimax-M1 был оценен в серии установленных критериев, которые тестируют расширенные мышления, разработку программного обеспечения и возможности использования инструментов.

На AIME 2024, эталон конкурса по математике, модель M1-80K оценивает точность 86,0%. Это также обеспечивает сильную производительность в кодировании и задачах с длинным контекстом, достигая:

65,0% на LiveCodebench
56,0% на проверке SWE-Bench
62,8% на Тау-Бенке
73,4% на Openai MRCR (версия 4-needle)

Эти результаты ставят Minimax-M1 перед другими конкурентами с открытым весом, такими как DeedSeek-R1 и QWEN3-235B-A22B, по нескольким сложным задачам.

В то время как модели с закрытым весом, такие как OPE O3 и Gemini 2.5 Pro, по-прежнему превышают некоторые тесты, Minimax-M1 значительно сужает разрыв в производительности, оставаясь свободно доступным по лицензии Apache-2.0.

Варианты развертывания и инструменты разработчика

Для развертывания Minimax рекомендует VLLM в качестве бэкэнда порции, ссылаясь на его оптимизацию для больших рабочих нагрузок, эффективности памяти и обработки запросов на пакет. Компания также предоставляет варианты развертывания с использованием библиотеки Transformers.

Minimax-M1 включает в себя способности вызова структурированной функции и упаковывается с API чат-бота, включающий онлайн-поиск, генерацию видео и изображений, синтез речи и инструменты голосового клонирования. Эти функции направлены на поддержку более широкого агентского поведения в реальных приложениях.

Последствия для технических лиц, принимающих решения и покупателей предприятий

Открытый доступ Minimax-M1, возможности длительного контекста и вычисляйте эффективность.

Для инженерных лидеров, ответственных за полный жизненный цикл LLMS, такой как оптимизация производительности модели и развертывание в условиях жестких сроков, Minimax-M1 предлагает более низкий профиль эксплуатационной стоимости при поддержке передовых задач. Его длинное контекстное окно может значительно сократить усилия по предварительной обработке для предприятий или данных, которые охватывают десятки или сотни тысяч токенов.

Для тех, кто управляет оркестровками ИИ, способность тонкой настройки и развертывания Minimax-M1 с использованием установленных инструментов, таких как VLLM или Transformers, поддерживает более легкую интеграцию в существующую инфраструктуру. Архитектура гибридного активации может помочь упростить стратегии масштабирования, а конкурентная производительность модели на многоэтапных рассуждениях и контрольных показателях разработки программного обеспечения предлагает базу с высокой способностью для внутренних апотиров или агентских систем.

С точки зрения платформы данных, команды, ответственные за поддержание эффективной, масштабируемой инфраструктуры, могут извлечь выгоду из поддержки M1 для структурированных вызовов функций и ее совместимости с автоматическими трубопроводами. Его природа с открытым исходным кодом позволяет командам адаптировать производительность к своему стеку без блокировки поставщиков.

Ведущие безопасности также могут найти ценность при оценке потенциала M1 для безопасного, локального развертывания модели с высокой способностью, которая не полагается на передачу конфиденциальных данных в сторонние конечные точки.

Взятые вместе, Minimax-M1 представляет гибкий вариант для организаций, стремящихся экспериментировать с расширенными возможностями ИИ или расширенными возможностями при управлении затратами, оставаясь в рамках эксплуатационных пределов и избегая запатентованных ограничений.

Выпуск сигнализирует о постоянном фокусе Minimax на практических, масштабируемых моделях ИИ. Объединяя открытый доступ с расширенной архитектурой и вычислительностью эффективности, Minimax-M1 может служить основой для разработчиков, создающих приложения следующего поколения, которые требуют как глубины рассуждений, так и понимания входного ввода.

Мы будем отслеживать другие релизы Minimax в течение недели. Следите за обновлениями!

Источник

Новости

Как вы можете убедиться, что ваш бренд появляется в поиске LLM? Новый Optimizer Adobe LLM стремится предоставить инструменты

admin 17.06.2025

admin

На фестивале Cannes Lions 16 июня 2025 года Adobe представила Adobe LLM Optimizer, новый инструмент корпоративного класса, предназначенный для того, чтобы помочь предприятиям улучшить их видимость в средах с генеративной ИИ.

Поскольку разговорные интерфейсы, такие как Chatgpt, Gemini и Claude, изменяют то, как потребители ищут и участвуют в Интернете, новое приложение Adobe направлено на то, чтобы дать брендам возможность понимать и влиять на то, как они появляются в этих быстро развивающихся цифровых пространствах.

Опираясь на данные Adobe Analytics, демонстрирующие 3500% увеличения трафика, связанного с ИИ, на места розничной торговли в США, и на 3200% на участки путешествий в период с июля 2024 года по май 2025 года, ход Adobe происходит в то время, когда переход к генеративным интерфейсам ускоряется. Эти инструменты не только изменяют механику обнаружения — они переопределяют то, что значит быть видимым и влиятельным в Интернете.

«Внедрение чат-услуг на двигателе Genai поразительно, с огромным годовым ростом»,-сказал Хареш Кумар, старший директор по стратегии и маркетингу продуктов для менеджера Adobe Experience. «Это принципиально меняет, как потребители взаимодействуют, ищут и находят информацию».

«Генеративные интерфейсы искусственного интеллекта становятся инструментами для того, как клиенты обнаруживают, принимают решения и принимают решения о покупке»,-добавил Лони Старк, вице-президент по стратегии и продукту для Adobe Experience Cloud. «С Adobe LLM Optimizer мы позволяем брендам уверенно ориентироваться в этом новом ландшафте, гарантируя, что они выделяются и выигрывают в моменты, которые имеют значение».

Geo — новый SEO

Хареш Кумар описал новую цифровую реальность как такую, в которой бренды больше не просто оптимизируют для поисковых систем, но для моделей искусственного интеллекта.

«SEO больше не просто ключевые слова и обратные ссылки», — сказал он. «В эпоху генеративного ИИ мы вступаем в новую парадигму — оптимизацию двигателей с генерацией или гео — где актуальность оценивается по -разному».

Этот развивающийся ландшафт требует новых методов отслеживания производительности и влияния обнаружения. Adobe LLM Optimizer стремится решить эту проблему с помощью трехсторонней структуры:

Автоматическая идентификация: Система обнаруживает, как контент бренда используется крупными моделями ИИ. Adobe отслеживает «отпечатки пальцев» индексированного контента и определяет, появляется ли — и как — он появляется в ответах на соответствующие запросы.
Автомальное предложите: Опираясь на собственные модели искусственного интеллекта Adobe, обученные для генеративных интерфейсов, инструмент рекомендует улучшения в рамках технической инфраструктуры и контента. Они могут варьироваться от исправления ошибок метаданных до улучшения полномочий и контекста в содержании часто задаваемых вопросов.
Auto Optimize: Для многих брендов задача не просто знает, что исправить — это быстро выполняет исправления. LLM Optimizer позволяет пользователям применять рекомендуемые изменения напрямую, часто без сильного участия со стороны команд разработчиков. «Мы помогаем брендам автоматически определить, как их контент работает в LLMS, автоматических улучшениях и автоматической оптимизировании, чтобы фактически реализовать эти изменения»,-сказал Кумар.

Раскрытие пробелов в видимости вашего бренда для пользователей LLM и помощь в их заполнении

Система Adobe позволяет маркетологам видеть, где их бренд недопредставлен в результатах, управляемых искусственным интеллектом. «Цель состоит в том, чтобы помочь брендам понять пробелы, где они не появляются в ответах искусственного интеллекта, и какие исправления могут сделать их более заметными», — сказал Кумар. Приложение рассчитывает прогнозируемое значение трафика для каждого предлагаемого изменения, позволяя группам определять приоритетные действия с высоким уровнем воздействия.

«Бренды часто спрашивают:« Нужно ли мне заботиться об этой новой коробке искусственного интеллекта? », — добавил Кумар. «Ответ — да — потому что трафик переключается там. Если вы не оптимизируете это, вы упускаете».

Один пример оптимизации контента включает сосредоточение внимания на форматах, которые LLMS естественно предпочитают.

«Страницы FAQ, как правило, работают исключительно хорошо в индексации LLM», — сказал Кумар. «Они предоставляют прямые, авторитетные ответы, которые предпочитают LLMS при генерации ответов».

Платформа Adobe не только рекомендует создать такой контент, но и помогает создавать его в рамках существующего голоса и структуры бренда благодаря нативной интеграции с Adobe Experience Manager.

Всегда при анализе и расширении охвата растущей библиотеки LLMS

LLM Optimizer использует комбинацию моделей Push и Pull для поддержания тока индексации контента. Когда новый контент опубликован или доступ к модели ИИ, система обновляет свой анализ и появляется понимание пользователя.

«Наша инфраструктура включает в себя как модели толкания, так и вытягивания. Всякий раз, когда контент обновляется или получается, мы захватываем этот отпечаток пальца и переводим его в наш механизм анализа», — объяснил Кумар.

В настоящее время продукт отслеживает производительность в нескольких лучших моделях ИИ, включая CHATGPT, Claude и Gemini, с планами расширения покрытия по мере появления новых моделей.

Доступность и интеграция

Adobe LLM Optimizer теперь доступен как автономный продукт или как нативную интеграцию с сайтами Adobe Experience Manager. Хотя ценообразование не раскрывается публично, Adobe подтвердила, что это отдельный продукт, требующий обновлений выбора и соглашения.

«LLM Optimizer — это новое предложение продукта, полностью интегрированное с менеджером Adobe Experience, но доступно в качестве автономного решения», — сказал Кумар. «Клиенты должны выбирать на основе их готовности ИИ».

С большим количеством потребителей тратят время внутри интерфейсов, управляемых искусственным интеллектом, Adobe позиционирует LLM Optimizer в качестве прямого решения для предприятий, ориентирующихся на эту новую местность. Он предлагает смесь видимости, автоматизации и стратегической ясности, поскольку цифровое взаимодействие выходит за рамки традиционных поисковых систем в генеративное будущее.

Источник