Категория:

Новости

Святой! Новый вариант на 200% более быстрый Deepseek R1-0528 появляется из немецкой лаборатории TNG Technology Consulting GmbH

admin 03.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Прошло чуть больше месяца с тех пор, как китайский Startup Startup Deepseek, ответвление в Гонконге, базирующееся в Гонконге, выпустила последнюю версию своей популярной модели с открытым исходным кодом Deepseek, R1-0528.

Как и его предшественник, Deepseek-R1, который потряс ИИ и глобальные бизнес-сообщества с тем, насколько дешево он был обучен и насколько хорошо он выполнял для рассуждений, все это доступно для разработчиков и предприятий бесплатно-R1-0528 уже адаптируется и переоценивается другими лабораториями ИИ и разработчиками, в значительной степени благодаря ее разрешенной лицензии Apache 2.0.

На этой неделе 24-летняя немецкая фирма TNG Technology Consulting GmbH выпустила одну такую адаптацию: Deepseek-TNG R1T2 Chimera, последняя модель в семействе крупной языковой модели (LLM). R1T2 обеспечивает заметный повышение эффективности и скорости, забив на более 90% из баллов разведки R1-0528при создании ответов с менее 40% от числа выходных токенов R1-0528Полем

Это означает, что он дает более короткие ответы, переводя непосредственно в более быстрый вывод и снижение вычислительных затратПолем На модельной карте TNG, опубликованной для своего нового R1T2 на сообществе обнимающегося сообщества Code Code, компания заявляет, что она «примерно на 20% быстрее, чем обычный R1» (тот, который выпущен в январе) «и более чем в два раза быстрее, чем R1-0528» (официальное обновление DeepSeek).

Уже реакция была невероятно положительной в сообществе разработчиков искусственного интеллекта. «Черт! Deepseek R1T2-200% быстрее, чем R1-0528 и 20% быстрее, чем R1»,-пишет Вайбхав (VB) Шривастав, старший лидер обнимающего лица, на X. «Значительно лучше, чем R1 на GPQA & AIME 24, созданный через Assembly of Experts с DS V3, R1 и R1-0528-и ITICED-LICED-LICED-LICED-LICED-LICED-LICEDED.

Этот усиление стало возможным благодаря методу сборки Experts (AOE) TNG-метод создания LLM, выборочно объединяя тензоры веса (внутренние параметры) из нескольких предварительно обученных моделей, которые TNG описал в статье, опубликованном в мае на Arxiv, не выпущенном онлайн-журнале Open Access.

Преемник оригинальной R1T Chimera, R1T2 вводит новую конфигурацию «Tri-Mind», которая интегрирует три родительские модели: DeepSeek-R1-0528, Deepseek-R1 и Deepseek-V3-0324. Результатом является модель, разработанная для поддержания высоких возможностей рассуждений при значительном снижении стоимости вывода.

R1T2 строится без дальнейшей настройки или переподготовки. Он наследует силу рассуждения R1-0528, структурированные модели мышления R1 и краткое, ориентированное на инструкции поведение V3-0324-обеспечивая более эффективную, но способную модель для предприятия и исследования.

Как сборка экспертов (AOE) отличается от смеси экспертов (MOE)

Смесь экспертов (MOE)-это архитектурный дизайн, в котором различные компоненты, или «эксперты», условно активированы на вход. В Moe LLM, таких как DeepSeek-V3 или Mixtral, только подмножество экспертных слоев модели (например, 8 из 256) активны во время любого данного прохода токена. Это позволяет очень крупным моделям достигать более высокого количества параметров и специализации при соблюдении управляемых затрат на вывод, потому что только часть сети оценивается на токен.

Сборка экспертов (AOE)-это метод слияния модели, а не архитектура. Он используется для создания новой модели из нескольких предварительно обученных моделей MOE путем избирательного интерполяции их тензоров веса.

«Эксперты» в AOE относятся к объединенным компонентам модели — как правило, маршрутируемых экспертных тензоров в слоях MOE — не эксперты, динамически активируемые во время выполнения.

Внедрение TNG AOE фокусируется в первую очередь на слиянии маршрутизированных экспертных тензоров-часть модели, наиболее ответственной за специализированные рассуждения,-при этом часто сохраняет более эффективные общие уровни и слои внимания из более быстрых моделей, таких как V3-0324. Этот подход позволяет полученным моделям химеры унаследовать прочность рассуждений, не воспроизводя условно -достоверность или задержку самых сильных родительских моделей.

Производительность и скорость: что на самом деле показывают тесты

Согласно сравнению с эталонами, представленными TNG, R1T2 достигает между 90% и 92% Из аргументации его самого интеллектуального родителя, DeepSeek-R1-0528, измеренные тестовыми наборами AIME-24, AIME-25 и GPQA-Diamond.

Однако, в отличие от Deepseek-R1-0528, который имеет тенденцию производить длинные, подробные ответы из-за его расширенных рассуждений в цепочке мыслей, R1T2 предназначен для того, чтобы быть гораздо более кратким. Он обеспечивает аналогичные интеллектуальные ответы, используя значительно меньше слов.

Вместо того, чтобы сосредоточиться на необработанном времени обработки или токенах в секунду, TNG измеряет «скорость» с точки зрения Выходное количество токенов за ответ — Практический прокси как для стоимости, так и задержки. Согласно тестам, разделяемым TNG, R1T2 генерирует ответы с использованием приблизительно 40% токенов требуется R1-0528.

Это переводится на На 60% снижение выходной длиныкоторый непосредственно уменьшает время вывода и вычисляет нагрузку, ускоряя ответы на 2 раза или 200%.

По сравнению с оригинальным DeepSeek-R1, R1T2 также рядом На 20% более лаконично в среднемпредлагая значимые успехи в эффективности для высокопроизводительных или чувствительных к затратам развертывания.

Эта эффективность не достигается за счет интеллекта. Как показано на эталонном диаграмме, представленной в технической статье TNG, R1T2 находится в желаемой зоне по кривой затрат на разведку и выход. Он сохраняет качество рассуждений, в то же время минимизируя многословие — результат, критический для корпоративных приложений, где скорость вывода, пропускная способность и стоимость всего вопроса.

Соображения развертывания и доступность

R1T2 выпускается по разрешающей лицензии MIT и теперь доступен для обнимающего лица, что означает, что он является открытым исходным кодом и доступен для использования и встроенного в коммерческие приложения.

TNG отмечает, что, хотя модель хорошо подходит для общих задач рассуждения, в настоящее время она не рекомендуется для вариантов использования, требующих вызова функций или использования инструментов из-за ограничений, унаследованных от его линии DeepSeek-R1. Они могут быть рассмотрены в будущих обновлениях.

Компания также советует европейским пользователям оценить соответствие Закону ЕС, который вступит в силу 2 августа 2025 года.

Предприятия, работающие в ЕС, должны пересмотреть соответствующие положения или рассмотреть возможность остановки использования модели после этой даты, если требования не могут быть выполнены.

Тем не менее, американские компании, работающие внутри страны и обслуживают американских пользователей, или других стран, находятся нет в зависимости от условий Закона ЕС, которые должны обеспечить им значительную гибкость при использовании и развертывании этой бесплатной, скорой модели рассуждения с открытым исходным кодом. Если они обслуживают пользователей в ЕС, некоторые положения Закона ЕС все равно будут применяться.

TNG уже сделала предыдущие варианты химеры, доступными через такие платформы, как OpenRouter и Plate, где они, как сообщается, ежедневно обрабатывали миллиарды токенов. Выпуск R1T2 представляет собой дальнейшую эволюцию в этой общественной доступности.

О TNG Technology Consulting GmbH

Основанная в январе 2001 года, TNG Technology Consulting GmbH базируется в Баварии, Германия, и насчитывает более 900 человек с высокой концентрацией докторов наук и технических специалистов.

Компания фокусируется на разработке программного обеспечения, искусственном интеллекте и DevOps/Cloud Services, обслуживая крупных предприятий в разных отраслях, таких как телекоммуникации, страхование, автомобильная, электронная коммерция и логистика.

TNG работает как консалтинговое партнерство, основанное на ценностях. Его уникальная структура, основанная на оперативных исследованиях и принципах самоуправления, поддерживает культуру технических инноваций.

Он активно участвует в общинах и исследованиях с открытым исходным кодом, как показано с помощью общественных выпусков, таких как R1T2, и публикация ее методологии Ассамблеи-экспертов.

Что это значит для тех, кто принимает технические решения предприятия

Для CTO, владельцев платформ AI, инженерных лидеров и групп по закупкам ИТ, R1T2 вводит ощутимые преимущества и стратегические варианты:

Более низкие затраты на вывод: Благодаря меньшему количеству выходных токенов на задачу, R1T2 снижает время графического процессора и потребление энергии, переводя непосредственно в экономию инфраструктуры, особенно важную в средах с высокой пропускной способностью или в реальном времени.
Высокое качество рассуждений без накладных расходов: Он сохраняет большую часть способности моделей высшего уровня, таких как R1-0528, но без их долговечности. Это идеально подходит для структурированных задач (математика, программирование, логика), где предпочтительны краткие ответы.
Открыть и модифицируемый: Лицензия MIT обеспечивает полное управление развертыванием и настройку, обеспечивая частное хостинг, выравнивание модели или дальнейшее обучение в регулируемых или воздушных средах.
Новая модульность: Подход AOE предполагает будущее, в котором модульные модели создаются, позволяя предприятиям собирать специализированные варианты путем рекомбинации сильных сторон существующих моделей, а не переподготовки с нуля.
Предостережения: Предприятия, полагаемые на функции, использование инструментов или передовое оркестровку агента должны отмечать текущие ограничения, хотя в будущих обновлениях химеры могут рассматриваться эти пробелы.

TNG поощряет исследователей, разработчиков и корпоративных пользователей изучать модель, проверить ее поведение и предоставлять обратную связь. R1T2 Химера доступна по адресу gurgingface.co/tngtech/deepseek-tng-r1t2-chimera, и технические запросы могут быть направлены на Research@tngtech.comПолем

Для технического опыта и методологии эталона, исследовательская работа TNG доступна по адресу arxiv: 2506.14794.

Источник

Новости

Уверенность в агентском ИИ: Почему инфраструктура оценки должна быть на первом месте

admin 03.07.2025

admin

По мере того, как агенты искусственного интеллекта вступают в развертывание в реальном мире, организации находятся под давлением, чтобы определить, где они принадлежат, как эффективно построить их и как их реализовать в масштабе. В Transforce 2025 в Venturebeat технические лидеры собрались, чтобы рассказать о том, как они трансформируют свой бизнес с агентами: Джоан Чен, генеральный партнер Foundation Capital; Шайлеш Налавади, вице -президент по управлению проектами с Sendbird; Твои вандерс, SVP трансформации ИИ в когниции; и Шон Малхотра, технический директор, ракетные компании.

https://www.youtube.com/watch?v=dchzgcf1poo

Несколько ведущих вариантов использования ИИ

«Первоначальная привлекательность любого из этих развертываний для агентов ИИ имеет тенденцию к спасению человеческого капитала — математика довольно проста», — сказал Налавади. «Однако это недооценивает трансформационные возможности, которые вы получаете с агентами ИИ».

В Rocket агенты искусственного интеллекта оказались мощными инструментами для увеличения преобразования веб -сайтов.

«Мы обнаружили, что с нашим агентом опыта, разговорного опыта на веб-сайте, клиенты в три раза чаще преобразуются, когда они пройдут через этот канал»,-сказал Малхотра.

Но это просто царапает поверхность. Например, ракетный инженер построил агента всего за два дня для автоматизации высокоспециализированной задачи: расчет налогов на передачу во время андеррайтинга ипотеки.

«Эти два дня усилий сэкономили нам миллион долларов в год», — сказал Малхотра. «В 2024 году мы сэкономили более миллиона часов членов команды, в основном от наших решений для искусственного интеллекта. Это не просто экономия расходов. Это также позволяет членам нашей команды сосредоточить свое время на людях, делающих то, что часто является крупнейшей финансовой транзакцией в своей жизни».

Агенты, по сути, нагружают отдельные члены команды. Этот миллион часов, сэкономивших, — это не всякая работа, воспроизводимая много раз. Это доли работы, что сотрудники не любят делать или не добавляли ценность для клиента. И этот сэкономивший миллион часов дает Rocket возможность заниматься большим количеством бизнеса.

«Некоторые из членов нашей команды смогли справиться с на 50% больше клиентов в прошлом году, чем годом ранее», — добавил Малхотра. «Это означает, что мы можем иметь более высокую пропускную способность, стимулировать больше бизнеса, и, опять же, мы видим более высокие показатели конверсии, потому что они тратят время на понимание потребностей клиента, а не выполняя гораздо большую работу, которую ИИ может сделать сейчас».

Борьба с сложностью агента

«Часть пути к нашим инженерным группам переходит от мышления разработки программного обеспечения — напишите один раз и протестируйте его, и он работает и дает один и тот же ответ 1000 раз — к более вероятностному подходу, где вы спрашиваете то же самое в LLM, и это дает разные ответы через некоторую вероятность», — сказал Налавади. «Многое из этого приводило людей.

Что помогло, так это то, что LLM прошли долгий путь, сказал Wananders. Если они построили что -то 18 месяцев или два года назад, им действительно пришлось выбрать правильную модель, иначе агент не будет работать так, как ожидалось. Теперь, по его словам, мы сейчас находимся на стадии, где большинство основных моделей ведут себя очень хорошо. Они более предсказуемы. Но сегодня задача состоит в том, чтобы объединить модели, обеспечивая отзывчивость, организует правильные модели в правильной последовательности и ткачество в правильных данных.

«У нас есть клиенты, которые продвигают десятки миллионов разговоров в год», — сказал Ваандерс. «Если вы автоматизируете, скажем, 30 миллионов разговоров за год, как это масштабируется в мире LLM? Это все, что нам пришлось открыть, простые вещи, даже от получения доступности модели с облачными поставщиками. Например, у нас есть достаточно квот с моделью Chatgpt.

По словам Малхотра, слой выше, оркестровав LLM, представляет собой сеть агентов. В разговорном опыте есть сеть агентов под капотом, и оркестратор решает, какой агент обрабатывает запрос от доступных.

«Если вы играете в это вперед и думаете о том, чтобы иметь сотни или тысячи агентов, которые способны на разные вещи, вы получаете некоторые действительно интересные технические проблемы», — сказал он. «Это становится большей проблемой, потому что задержка и время имеют значение. Этот агент маршрутизация станет очень интересной проблемой для решения в ближайшие годы».

Направляя отношения с поставщиками

До этого момента первый шаг для большинства компаний, запущенных агентского искусственного интеллекта, строил внутренние, потому что специализированные инструменты еще не существовали. Но вы не можете дифференцировать и создавать ценность, создавая общую инфраструктуру LLM или инфраструктуру искусственного интеллекта, и вам нужен специализированный опыт, чтобы выйти за рамки первоначальной сборки, отладка, итерацию и улучшить то, что было построено, а также поддержание инфраструктуры.

«Часто мы находим самые успешные разговоры, которые мы проводим с потенциальными клиентами, как правило, являются тем, кто уже создал что-то собственное»,-сказал Налавади. «Они быстро понимают, что добраться до 1.0 — это нормально, но по мере развития мира и по мере развития инфраструктуры и, как им необходимо обмениваться технологией на что -то новое, у них нет возможности организовать все эти вещи».

Подготовка к агентской сложности ИИ

Теоретически, агент AI будет расти только в сложности — число агентов в организации будет расти, и они начнут учиться друг у друга, и количество вариантов использования будет взорваться. Как организации могут подготовиться к вызову?

«Это означает, что проверки и балансы в вашей системе будут подвергаться стрессу больше», — сказал Малхотра. «Для чего -то, у которого есть процесс регулирования, у вас есть человек в цикле, чтобы убедиться, что кто -то подписывает это. Для критических внутренних процессов или доступа к данным есть ли у вас наблюдаемость? У вас есть правильное предупреждение и мониторинг, чтобы, если что -то пойдет не так, вы знали, что это идет не так? Разблокирует, вы должны это сделать ».

Итак, как вы можете быть уверены, что агент ИИ будет вести себя надежно по мере его развития?

«Эта часть действительно сложна, если вы не думали об этом в начале», — сказал Налавади. «Короткий ответ заключается в том, что еще до того, как вы начнете его создавать, у вас должна быть инфраструктура Eval. Убедитесь, что у вас есть строгая среда, в которой вы знаете, как выглядит хорошо, от агента искусственного интеллекта, и что у вас есть этот тестовый набор. Продолжайте обращаться к нему, когда вы делаете улучшения. Очень упрощенный способ размышления о Eval — это модульные испытания для вашей агентской системы».

Проблема в том, что это не определенное, добавлено. Единое тестирование имеет решающее значение, но самая большая проблема в том, что вы не знаете, чего не знаете — какое неправильное поведение может показать агент, как это может отреагировать в любой конкретной ситуации.

«Вы можете узнать это, только моделируя разговоры в масштабе, подтолкнув его под тысячи различных сценариев, а затем анализируя, как они выдерживают и как он реагирует», — сказал Ваандерс.

Источник

Новости

Преобразование 2025: Почему наблюдение имеет решающее значение для экосистем агента ИИ

admin 02.07.2025

admin

Автономная программная революция наступает. В Transform 2025 Ашан Вилли, генеральный директор New Relic и Sam Witteveen, генеральный директор и соучредитель Red Dragon AI, рассказал о том, как они инструментальные агентские системы для измеримой ROI и составлению маркировки дорожной карты инфраструктуры, чтобы максимизировать агент.

https://www.youtube.com/watch?v=d-l0sh8pyqm

New Relic обеспечивает наблюдение за клиентами, захватывая и коррелируя применение, журнал и телеметрию инфраструктуры в режиме реального времени. Наблюдаемость выходит за рамки мониторинга — речь идет о оснащении команд с контекстом и пониманием, необходимыми для понимания, устранения неполадок и оптимизации сложных систем, даже перед лицом неожиданных проблем. Сегодня это стало значительно более сложным предприятием, когда в смеси находятся генеративные и агентские ИИ. А наблюдаемость для компании теперь включает в себя мониторинг всего, от Nvidia NIM, DeepSeek, CHATGPT и т. Д. — использование его мониторинга ИИ выросло примерно на 30%, квартал за квартал, что отражает ускорение усыновления.

«Другая вещь, которую мы видим, — это огромное разнообразие в моделях», — сказал Вилли. «Предприятия начались с GPT, но начинают использовать целую группу моделей. Мы видели, что на 92% увеличивается дисперсия используемых моделей. И мы начинаем видеть, что предприятия применяют больше моделей. Вопрос в том, как вы измеряете эффективность?»

Наблюдаемость в агентском мире

Другими словами, как развивается наблюдение? Это большой вопрос. Варианты использования сильно различаются в разных отраслях, и функциональность принципиально отличается для каждой отдельной компании, в зависимости от размера и целей. Финансовая фирма может быть сосредоточена на максимизации маржи EBITDA, в то время как компания, ориентированная на продукт, измеряет скорость на рынок наряду с контролем качества.

Когда в 2008 году была основана новая реликвия, центром тяжести для наблюдения стал мониторинг приложений для SaaS, Mobile, а затем в конечном итоге облачная инфраструктура. Рост ИИ и агентского ИИ возвращают наблюдение в приложения, поскольку агенты, микроагенты и нано-агенты работают и производят код, написанный ИИ.

ИИ для наблюдения

По мере роста количества услуг и микросервисов, особенно для нативных в цифровых организациях, когнитивная нагрузка для любых задач наблюдения за обращением человека становится подавляющей. Конечно, ИИ может помочь этому, говорит Вилли.

«То, как это сработает, это будет достаточно информации, где вы будете работать в кооперативном режиме», — пояснил он. «Обещание агентов в наблюдении состоит в том, чтобы взять некоторые из этих автоматических рабочих нагрузок и заставить их случиться. Это демократизирует их большим количеством людей».

Отставаемость единой платформы агента

Одна платформа для наблюдения использует преимущества агентского мира. Агенты автоматизируют рабочие процессы, но они формируют глубокие интеграции во всю экосистему, во всех нескольких инструментах, которые организация имеет в игре, таких как жгут, GitHub, ServiceNow и так далее. С агентством ИИ разработчиков могут быть предупреждены о том, что происходит с ошибками кода в любом месте экосистемы и немедленно исправляют их, не покидая свою платформу кодирования.

Другими словами, если есть проблема с кодом, развернутым в GitHub, платформа наблюдений, работающая от агентов, может обнаружить его, определить, как его решить, а затем полностью предупредить инженера или автоматизировать процесс.

«Наш агент принципиально смотрит на каждую информацию, которую мы имеем на нашей платформе», — сказал Вилли. «Это может быть что -то от того, как выполняется приложение, как работает базовая структура Azure или AWS — все, что, по нашему мнению, имеет отношение к этому развертыванию кода. Мы называем это агентскими навыками. Мы не полагаемся на третью сторону, чтобы узнать API и так далее».

Например, в GitHub они сообщают разработчику, когда код работает нормально, когда ошибки обрабатываются, или даже когда необходим откат программного обеспечения, а затем автоматизируют этот откат с одобрением разработчика. Следующий шаг, который, как объявил новый Relic в прошлом месяце, работает с агентом по кодированию Copilot, чтобы сообщить разработчику, с какими линиями кода он видит эту проблему. Затем Copilot возвращается, исправляет проблему, а затем получает версию, готовую к развертыванию снова.

Будущее агентского ИИ

По словам Вилли, когда организации применяют агент и начнут адаптироваться к нему, они обнаруживают, что наблюдаемость является важной частью его функциональности.

«Когда вы начнете строить все эти агентские интеграции и части, вы захотите знать, что делает агент», — говорит он. «Это своего рода рассуждение для инфраструктуры. Разумение выяснить, что происходит в вашем производстве. Вот что принесет наблюдение, и мы на переднем крае».

Источник

Новости

Яркие данные победили Elon Musk и Meta в суде — теперь его платформа AI за 100 миллионов долларов принимает Big Tech

admin 02.07.2025

admin

Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

Bright Data, израильская компания Scrapeing Company, которая победила Meta и Elon Musk’s X в федеральном суде, обнародовала комплексный набор инфраструктуры искусственного интеллекта в среду, предназначенный для того, чтобы предоставить систему искусственного интеллекта, предоставляемый доступ к веб-данным в режиме реального времени-способность, которую компания утверждает, что крупные платформы технологий пытаются монолизировать.

Объявление о глубоком поиске, Browser.ai и расширенных протоколах сбора данных представляет собой драматическое расширение для десятилетней компании, которая превратилась из специализированной услуги по цене в Интернет в то, что генеральный директор или Lenchner называет «уникальным уровнем инфраструктуры для компаний AI». Этот шаг происходит в качестве компаний искусственного интеллекта, которые все чаще пытаются получить доступ к текущей веб -информации, необходимой для питания чат -ботов, автономных агентов и других приложений искусственного интеллекта.

«Интеллект сегодняшних LLMS больше не является его ограничивающим фактором; доступ к доступу», — сказал Ленчнер в эксклюзивном интервью VentureBeat. «Мы потратили последнее десятилетие, борясь за открытый доступ к общедоступным веб-данным, и эти новые предложения приведут нас к следующей главе в нашем путешествии, одна из которых характеризуется по-настоящему доступными данными и последующим ростом контекстных агентов».

Запуск следует за громкими юридическими победами Bright Data в 2024 году, когда федеральные судьи отклонили судебные процессы как от Meta, так и из X, утверждая, что компания незаконно покраснела свои платформы. Эти постановления установили решающий юридический прецедент, определяющий то, что составляет «публичные данные» в Интернете — информация, которую можно просмотреть без входа в систему и, следовательно, может быть юридически собрано и используется.

Суд победит против Meta и X устанавливает юридический прецедент для прав в Интернете

Судебные дела показали, что как Meta, так и X были яркими клиентами данных, даже предъявляющими иск на компанию, подчеркивая противоречивую позицию, которую многие технологические гиганты заняли сеть. Постановления имеют более широкие последствия для индустрии ИИ, которая в значительной степени зависит от веб -данных для обучения и управления языковыми моделями.

«В суде было выявлено, что они оба были ярким клиентом данных, потому что всем нужны данные, все, особенно те, кто строит модели», — пояснил Ленчнер. «Мы единственная компания, которая имеет финансовые ресурсы, и я бы даже сказал, что смелость сделать это».

Судья Уильям Алсуп, который руководил делом X, писал, что предоставление компаниям социальных сетей «бесплатно решать, на любой основе, которые могут собирать и использовать риски данных», создавая «информационные монополии, которые будут переживать общественные интересы». Постановление установило, что данные, доступные для просмотра без входа в систему, представляют собой общественную информацию, которая может быть погашческой царапин.

Bright Data в настоящее время подала контактный костюм против X, утверждая, что платформа нарушила антимонопольные законы, пытаясь создать монополию данных в пользу компании Musk’s AI, XAI. «Единственная причина, по которой X пытается остановить яркие данные от того, чтобы позволить своим клиентам соскребить X, заключается в том, что они будут единственной организацией, которая может пользоваться соответствующими качественными данными, которые производит X», — сказал Ленчнер.

Глубокий поиск и браузер.

Новые продукты компании рассматривают то, что Lenchner идентифицирует как три основных требования для систем искусственного интеллекта: алгоритмы, вычисление питания и доступ к данным. Хотя яркие данные не разрабатывают алгоритмы ИИ и не предоставляют вычислительные ресурсы, они направлены на то, чтобы стать окончательным решением для третьего требования.

Глубокий поиск функционирует как исследовательский механизм естественного языка, предназначенный для ответа на сложные многослойные бизнес-вопросы в режиме реального времени. В отличие от поисковых систем общего назначения или чат-ботов ИИ, которые предоставляют резюме, Deep Lookup специализируется на комплексных результатах для запросов, начиная с «Найти все». Например, пользователи могут попросить «все судоходные компании, которые проходили Панамские и Суэцкие каналы в 2023 году, чьи доходы 3 квартала снизились более чем на 2 процента».

Система основана на массивном веб -архиве Bright Data, который в настоящее время содержит более 200 миллиардов HTML -страниц и добавляет 15 миллиардов в месяц. Ожидается, что к следующему году архив превысит 500 миллиардов страниц. «Это не только случайные веб -страницы, это на самом деле то, что заботится мир, потому что наши 20 000 клиентов представляют миллиарды пользователей интернета», — отметил Ленчнер.

Browser.ai представляет то, что компания называет «первым не блокируемым, AI-родным браузером отрасли». Облачная служба, разработанная специально для автономных агентов искусственного интеллекта, имитирует поведение человека для доступа к веб-сайтам без запуска систем обнаружения бот. Он поддерживает команды естественного языка и может выполнять сложные веб -взаимодействия, такие как бронирование рейсов или бронирование ресторанов.

По словам компании, инфраструктура браузера уже ежедневно обрабатывает более 150 миллионов веб -действий. «Почти все они являются клиентами», — сказал Ленчнер о компаниях -агентах, которые привели к значительному финансированию. «Потому что то, что мы выяснили, и они выяснили, так это то, что мы решаем эту проблему ввода на веб -сайт, не будучи блокированным и выполняя веб -действия на веб -сайте».

MCP-серверы (протокол контекста модели) обеспечивает уровень управления с низкой задержкой, позволяющий агентам искусственного интеллекта искать, ползуть и извлекать живые данные в режиме реального времени. Протокол позволяет разработчикам создавать системы ИИ, которые могут действовать на текущую информацию, а не полагаться исключительно на учебные данные.

Патентный портфель и прокси -сеть создают конкурентный ров против блокировки

Конкурентное преимущество Bright Data связано с тем, что Ленчнер описывает как «одержимость» с преодолением механизмов блокировки веб -сайта. Компания имеет более 5500 патентных заявлений на свои технологии и управляет крупнейшей в мире прокси -сетью с более чем 150 миллионами IP -адресов в 195 странах.

«У нас такой хороший взгляд в Интернет», — объяснил Ленчнер. «В течение долгого времени мы наносили на карту интернет, и уже долгое время мы также архивируем большие куски Интернета».

Подход компании включает в себя сложные методы для имитации поведения человека, используя реальные устройства, IP -адреса и отпечатки пальцев браузеров, а не простые автоматизированные сценарии. Это делает обнаружение и блокирование чрезвычайно трудным для веб -сайтов.

«Единственный способ заблокировать нас практически, — поставить данные за вход, тогда мы даже не попробуем», — сказал Ленчнер. «Иногда существует новая логика блокировки, которую мы не решаем немедленно. Наша исследовательская команда займет 12 часов, три дня, это самое большее, что было, и мы откроем ее».

Выручка превышает 100 миллионов долларов, поскольку спрос на ИИ взрывается после чатгпта

В то время как яркие данные остаются в частной собственности в частной инвестиционной компании, Lenchner подтвердил с VentureBeat годовой повторяющийся доход компании значительно превышает 100 миллионов долларов. С момента запуска Chatgpt в конце 2022 года бизнес добился взрывного роста, когда компании искусственного интеллекта пытались получить доступ к данным обучения и информации в режиме реального времени.

«Начиная с марта 2023 года, что в значительной степени, когда GPT-3 изменил мир, ИИ или то, что мы называем данные для ИИ, вариант использования просто взорвался для нас как компании»,-сказал Ленчнер. «Все остальное также растет, потому что каждому нужно больше данных, точка. Но этот случай использования похож на то, что мы видели раньше».

Компания обслуживает более 20 000 предприятий, в том числе компании из списка Fortune 500 и крупные лаборатории ИИ. Традиционные клиенты включают платформы электронной коммерции, отслеживая цены конкурентов, фирмы по финансовым услугам, ищущие рыночную разведку, и предприятия, проводящие бизнес-исследования.

Bright Data инвестировала в инфраструктуру соответствия в инфраструктуре соответствия для решения проблем конфиденциальности вокруг сбора данных. Компания следует европейским правилам GDPR и Калифорнии CCPA, автоматически уведомляя отдельных лиц, когда их личная информация собирается из общественных источников и предоставление вариантов удаления.

«Регламент и законодательство ясны с тех пор, как европейские GDPR и, по крайней мере, Калифорния и CCPA -правила», — пояснил Ленчнер. «Если мы собрали ваш адрес электронной почты, например, мы автоматически отправим вам электронное письмо с надписью:« Эй, это то, кем мы являемся. Мы собрали вашу личную информацию из общественного домена. Вот огромная кнопка, которую вы можете нажать, если вы хотите просмотреть ее, и вы можете попросить его удалить ».

Компания поддерживает большую группу по соблюдению и обширную документацию о своей практике, которая оказалась ценной во время судебного разбирательства. «Мы предприятия особенно любим нас, потому что у нас есть наша этическая позиция, которая была изучена в американских судах дважды», — сказал Ленчнер.

Web Access Wars усиливается, поскольку технические гиганты ищут монополии данных

Врастание за доступ к веб -данным отражает более широкую напряженность в отрасли искусственного интеллекта в отношении контроля информации и конкурентного преимущества. По мере того, как системы ИИ становятся более сложными, доступ к текущим, всеобъемлющим веб -данным становится все более ценным — и спорным.

Ленчнер предсказывает, что сеть станет «более закрытым» с течением времени, аналогично тому, как Google поддерживает эксклюзивный доступ к своим возможностям в Интернете, в то время как другие должны использовать альтернативные услуги. «Несколько технических гигантов получат бесплатный доступ к каждому веб -сайту со своими агентами», — сказал он. «Остальные должны будут использовать нашу инфраструктуру или чужую инфраструктуру».

Компания также наблюдает за новыми тенденциями, в том числе предприятиями, соскребающими чат -боты искусственного интеллекта для маркетинговых целей и появление новых протоколов, таких как MCP, которые позволяют агентам ИИ более эффективно взаимодействовать с веб -службами.

«Все эти ребята, которые потребляют огромные объемы данных, и все мы используем их, все идут на создание мозгов роботов», — сказал Ленчнер. «Это нормально, что у вас есть чат -бот, который разговаривает с человеком, потому что это в конце концов, что сделает робот».

Мозги робота и экономика агента способствуют следующему этапу роста

Преобразование Bright Data от услуги сетевого скребки в поставщика инфраструктуры искусственного интеллекта отражает быстро развивающиеся потребности индустрии искусственного интеллекта. Поскольку компании стремятся развернуть агенты ИИ и автономные системы, доступ к веб-данным в реальном времени становится таким же решающим, как и вычислительная мощность и алгоритмическая сложность.

Юридические прецеденты, установленные благодаря победам в суде Bright Data в суде, могут оказаться такими же значительными, как и его технические инновации, потенциально формируя то, как вся индустрия искусственного интеллекта доступно и использует веб -информацию. В связи с тем, что крупные технологические платформы все чаще ограничивают доступ к данным, одновременно разработав свои собственные системы ИИ, независимые поставщики инфраструктуры, такие как яркие данные, могут стать важными для поддержания конкурентного баланса в экосистеме ИИ.

«Мы инфраструктурная компания», — подчеркнул Ленчнер. «Мы очень талантливые инженеры, которые почти никуда идут, просто сядьте с нашими компьютерами и пишем код. Мы делаем это хорошо. У нас нет намерений делать что -либо еще».

Во вторник Beta Deep Lookup выпускается во вторник для бизнес -клиентов, с общим публичным доступом, доступным через список ожидания. Серверы Browser.ai и MCP уже доступны для корпоративных клиентов через существующую платформу Bright Data.

Источник

Новости

От 30 дней до 1: миграция Chevron’s Cloud Migration ROI в реальных числах

admin 02.07.2025

admin

ИИ № 1 меняет 150-летний энергетический гигант Chevron? Как технические практики взаимодействуют с данными.

Оффшор в Персидском заливе, Chevron — бурение для нефтяных ресурсов в милях ниже пола океана в карманах и водохранилищах, которые могут или не могут дать результаты. Агентические архитектуры должны иметь возможность обрабатывать петабайты критических данных, которые не только дают представление о том, где бурить, но и как сделать это без отрицательного влияния на жизнь человека или окружающую среду — в облаке и на грани.

«Данные являются конечным ускорением для всех наших вариантов использования искусственного интеллекта», — заявил на сцене на VB в этом году Стив Боуман, GM для AT Enterprise AI в Chevron. «Это то, что мы обняли большим образом».

Как ИИ меняет способ взаимодействия Chevron с невыразимыми количествами данных

В 2019 году Chevron объединился с Microsoft и Compelire Services Company SLB в проекте под названием «Triple Crown» для модернизации и стандартизации облачных инструментов. Три компании построили Azure-Contive Apps в Delfi* Delfi* когнитивные исследования и защиту (E & P), чтобы помочь Chevron Process, визуализировать, интерпретировать и получать значимую информацию от множества источников данных. Delfi* E & P охватывает разведку, разработку, производство и среднюю среду.

Энергетический гигант в размере 250 миллиардов долларов с 1000 человек в 180 странах по всему миру имеет «огромный объем данных», — сказал Боуман. И в то время как Chevron имеет «очень надежные системы записи», большие объемы неструктурированных данных существовали в различных точках акций.

За эти годы Chevron построил несколько «действительно великих алгоритмов», которые традиционно работали в малых ломах, объяснил он. Тем не менее, наблюдается растущий толчок к масштабированию, запуская эти алгоритмы в гораздо большем масштабе и более эффективно в облаке.

Делая это: «Вместо того, чтобы смотреть на один три мили на три мили в Мексиканском заливе или Америке, мы можем посмотреть на гораздо более крупные районы, на которых мы пытаемся работать»,-сказал он.

Сотрудничество Microsoft-SLB было сосредоточено на трех продуктах: FDPLAN, Dlillplan и Drillops. FDPLAN использует высокопроизводительные вычисления (HPC) для интеграции подземных моделей, что позволяет сотрудникам принимать более быстрые и более информированные решения в сложных средах, используя наилучшие доступные данные. Например, в Персидском заливе FDPLAN помогает Chevron анализировать различные варианты разработки резервуара, чтобы его команды могли сосредоточиться на наиболее оптимальных сценариях.

Между тем, DrillPlan предназначен для инженеров, разрабатывающих планы бурения, в то время как сверстники используются командами, которые сверляют скважины.

Перед этой инициативой некоторые подповерхностные сотрудники Chevron тратили до 75% своего времени в поисках данных, отметил Боуман. «Мы видим, что время, когда люди проводят, на поиски данных начинают уменьшаться, и скорость, с которой мы можем получить понимание, действительно ускоряется», — сказал Боуман.

DrillPlan также помог Chevron сократить свой глубоководной процесс планирования скважин на 30 дней. Например, в Аргентине компания сократила время своего цикла планирования для подушки с восьмидушной прокладкой с двух недель до менее одного дня.

В конечном счете, Боуман назвал переезд в облако «реальный множитель силы», который позволил Chevron вступить в новую фазу модернизации.

Сосредоточение внимания на модульных системах

Теперь, когда они работают над интеграцией ИИ, команда Боумана в значительной степени сосредотачивается на модульности.

Он указал, что первоначальный «Ask» был поиск; Они предложили очень простой вариант использования, позволяющий людям получать информацию, которая существовала в «очень, очень» сложной SharePoint. Но поскольку пользователи все больше и больше занимаются, их просьбы растут; В ответ его команда добавила агента поиска, агент, который может оценить результаты с технической точки зрения и агента оркестратора, чтобы связать их.

«Мы действительно довольно рано поняли, что нам нужно сильно опираться на модульность, потому что мы знали, что эти агенты будут вызваны в других рабочих процессах, основываясь на спросе», — сказал он.

Еще одна попытка — «Chevron Assist», интерфейс чата для работы по стандартам здоровья, безопасности и окружающей среды (HSE). «Мы работаем в чрезвычайно сложной индустрии, и ставки игры всегда выше», — сказал Боуман.

Инструмент предоставляет людям естественный способ взаимодействия с документами, связанными с критическими стандартами и процедурами, устраняя необходимость щелкнуть ссылки или поиск в документах. Так, например, пользователь может объединить все стандарты, которые им нужны для буровой команды, операционной команды и команды по обслуживанию.

«Мы поняли, что не думали о проблеме в том, как отдельные пользователи думают об этих вещах одновременно», — сказал Боуман. «В этой интеграции было так много ценности. Это действительно изменило способ, которым люди делают свою работу».

Не сосредотачиваясь на POCS

Поскольку он создает свои программы, команда Боумена активно избегала попадания в привычку привлекать пилотов и доказательств концепций (POC), которые слишком долго тянутся. «В этом нет никакой ценности», — сказал он.

По его словам, цель всегда заключалась в том, чтобы развернуть наиболее многообещающие случаи использования в производстве. Все должно быть связано обратно с итогой Chevron и предложить сильное ценностное предложение.

«Мы знаем, что благодаря кураторскому набору данных и действительно восторженным, благонамеренным группам пользователей и очень узко определенным вариантом использования, существует почти 100% уверенность в том, что ваш POC будет успешным»,-сказал Боуман.

Другим важным элементом в развертывании инструментов следующего поколения является преодоление трастового препятствия. С точки зрения изменения поведения, лидеры предприятия должны понимать не только ожидания, которые компания ставит на пользователей на местном и на грани, но и то, что эти пользователи ожидают в свою очередь, сказал Боуман.

«Если вы создали эти системы или инструменты таким образом, что люди, которые собираются наложить на них руки, не доверяют им или не могут доверять им, или есть что -то, что они сдерживают, то вы никогда не получите полное восторженное развертывание», — сказал он.

Примечание редактора: как благодарность нашим читателям, мы открыли раннюю регистрацию птиц для VB Transform 2026-всего 200 долларов. Здесь AIM Ambition встречает эксплуатационную реальность, и вы захотите быть в комнате. Зарезервируйте свое место сейчас.

Источник

Новости

Первый шаг в модернизации: отказ от технического долга

admin 01.07.2025

admin

Представлено Mongodb

Технический долг долгое время был бичом ИТ -отделов, но сегодня он накапливается быстрее, чем когда -либо. Мощные компьютерные, технологические инновации, такие как ИИ и скорость на рынке, требуют современных, масштабируемых решений. К сожалению, многие предприятия стремятся вперед с устаревшими системами и устаревшими приложениями, действуя под неправильным представлением о том, что решение технического долга просто замедляет их, потому что она требует времени и бюджета, которое организация считает, что не может позволить себе потратить. Но в сегодняшнем ландшафте организации действительно не могут себе позволить огромные скрытые затраты на устаревшие приложения, которые напрямую влияют на производительность, безопасность и инновации.

«Модернизация-это не только догоняние-это создание готовой к будущему основу для инноваций»,-говорит Пол Дон, полевой технический директор, модернизация в MongoDB. «Истинная стоимость статус -кво не просто неэффективность — это упущенные возможности, когда рынок требует гибкости, заставляя разработчиков их ценное время для поддержания работы устаревшей архитектуры по сравнению с позиционированием компании для искусственного интеллекта с современной инфраструктурой и приложениями».

Затраты на монтаж технического долга

ИТ -лидеры хорошо знают о конкретных затратах, которые влекут устаревшие системы. Например, ИТ -команда в высшем банке обратилась к MongoDB, когда они обнаружили, что из бюджета своей команды в 16 миллионов долларов США было потрачено 15 миллионов долларов на поддержание устаревшей архитектуры. Это оставило банк с инновациями всего 1 миллион долларов.

Существуют также скрытые затраты, которые напрямую влияют на производительность, безопасность и инновации. Не все инфраструктуры созданы для современных, преобразующих приложений, которые жизненно важны на современном конкурентном рынке. Кроме того, производительность разработчиков мешает технологиям, созданной на устаревшем коде, что затрудняет разработчикам поддерживать и реализовать новые функции, а также не хватает масштабируемости и устойчивости, необходимых для поддержки современных потребностей пользователей и практики разработки.

Кроме того, эти системы делают организации значительно более уязвимыми к угрозам, потому что устаревшая хрупкая архитектура может быть трудно обновлять или защитить. Некоторые компании не имеют необходимых институциональных знаний или видимости в основном устаревшем кодексе, который также повышает уязвимость. И многие из этих систем просто не соответствуют или больше не поддерживаются, увеличивая присущие новым рискам, которые ИИ и другие современные приложения могут добавить к технологическому стеку. Инновации полностью подстегнуты, если предприятия не обращаются за этими потенциальными пробелами в безопасности.

«Чтобы преодолеть эти проблемы и приходить в голову в быстро меняющемся мире, организациям необходимо принять гибкие, высокопроизводительные платформы данных»,-говорит Дон. «Таким образом, они уменьшат сложность инфраструктуры и накладные расходы на обслуживание. Современные базы данных также помогут организациям повысить безопасность с помощью шифрования, инструментов соответствия и автоматических обновлений, а также архитектура, предназначенная для высокопроизводительных приложений, помогает им масштабировать.

Оценка степени и влияния архитектурных ограничений

На высоком уровне определение того, когда пришло время модернизации, заключается в количественной оценке затрат, риска и сложности. С точки зрения доллара, это может показаться таким же простым, как сравнение затрат на поддержание устаревших систем и инвестиций в новую архитектуру. Но истинный расчет включает скрытые затраты, такие как часы разработчика, утраченные для исправления устаревших систем, и альтернативные затраты на неспособность быстро адаптироваться к потребностям бизнеса.

Истинная модернизация-это не подъемная и сдвига-это трансформация полного стека. Это означает разбивание монолитных приложений на масштабируемые микросервисы, переписывание устаревшего кода приложения на современные языки и заменить жесткие модели реляционных данных на гибкие, облачные платформы, которые поддерживают доступ в реальном времени, глобальную масштабируемость и гибкость разработчика.

Многие организации сотрудничают с MongoDB для достижения такого рода трансформации. Например, чтобы убедиться, что они не отказались от своей производительности, емкости хранения или поддержки, действительно нажали MongoDB, чтобы упростить эффективность инфраструктуры. Всего за шесть месяцев они сократили общие затраты на 27% — намного превышая первоначальные цели компании по модернизации.

Также необходимо учитывать безопасность, оценивая, сколько устаревших систем риска увеличивает общее положение организации. И с точки зрения операций и инноваций, очень важно учитывать будущие цели и общие цели. Вот почему Bendigo Bank работал с MongoDB, чтобы модернизировать свои основные банковские технологии, используя генеративный ИИ для модернизации системы доставки устаревшего агента банка (операция розничной торговцы) менее чем за три месяца. Банк стремился позволить своим разработчикам сосредоточиться на более значимых инновациях, чтобы банк мог оставаться гибким на быстро развивающемся рынке.

В целом, Bendigo Bank мигрировал на Mongodb Atlas за одну десятую стоимость традиционной миграции наследия на облака. Кроме того, MongoDB Solutions помогли сократить время разработки, необходимое для переноса основного банковского приложения из устаревшей реляционной базы данных в MongoDB Atlas на 70%. Благодаря новым инструментам ИИ они автоматизировали повторяющиеся задачи разработчиков, чтобы ускорить инновации разработчиков. Например, автоматизации с AI снижали время, затрачиваемое на тестовые приложения с более чем 80 часов до всего лишь пяти минут.

Но проекты по модернизации, как правило, являются уравновешивающим актом, и замена всего сразу может быть задачей Gargantuan. Выбор того, как решить проблему, сводится к приоритетам, определяя, где существуют болевые точки и где будет наибольшее влияние на бизнес. Стоимость ничего не превысит стоимость чего -либо.

Например, Toyota Connecta недавно испытала проблемы с надежностью с решением устаревшей базы данных, лежащей в основе технологии, основанной на телеметрии, которая поддерживает такие решения для подключения, как Safety Connect, в более чем 9 миллионах транспортных средств Toyota и Lexus в Северной Америке. Компания решила перейти на Amazon Web Services (AWS) и Mongodb Atlas, интегрированный набор услуг данных, ориентированный на облачную базу данных, предназначенную для ускорения и упрощения построения с помощью данных. Safety Connect получила доступность 99,99%, и компания нацелена на это число в месяц, согласно внутренним измерениям Toyota Connected.

«Обычно мы заходим и занимаемся некоторыми крупнейшими, самыми уродскими приложениями компании», — говорит Дон. «То, как вы разрабатываете решение в эту эпоху ИИ, заключается в том, чтобы найти правильного партнера, который может помочь развивать не только ваши приложения, но и вашу вспомогательную базу данных для консолидации рабочих нагрузок, уменьшения сложности и адаптироваться быстрым, гибким способом».

Как современные решения базы данных включают рабочие нагрузки, управляемые ИИ

ИИ часто является катализатором, изменяющим игру-после ликвидации технического долга компания может использовать весь потенциал, который она предлагает. Чтобы мгновенно отреагировать и принимать решения в режиме реального времени в таких вещах, как динамическое ценообразование, обнаружение мошенничества, адаптивный пользовательский опыт и многое другое, решения ИИ зависят от жидкости, мгновенно доступных данных. Современные базы данных могут сделать это путем консолидации структурированных и неструктурированных данных, чтобы помочь организациям масштабировать без ограничений, а также адаптироваться к рабочим нагрузкам ИИ, массовым объемам данных, операциям с низкой задержкой и удовлетворения требований любой рабочей нагрузки ИИ, защищая конфиденциальную информацию как в RET, так и в движении.

В то время как модернизация часто рассматривается как сложная и трудоемкая, MongoDB помог ускорить и упростить процесс модернизации для многих организаций, обеспечивая модернизацию с полной стек. Бесплатная модель данных компании и распределенная архитектура создаются для управления данными в масштабе по мере появления новых технологий, что делает ее идеальной основой для приложений с AI. Эти решения делают разработчиков не менее чем на 50% более продуктивными, и некоторые клиенты наблюдают, как повышение производительности достигает 70%, говорит Dode.

Для Ломбарда Одиера, инициатива по модернизации с помощью A-ассистента с MongoDB, позволила банку мигрировать код в три раза быстрее, чем предыдущие миграции; Переместить приложения из устаревших реляционных баз данных в MongoDB в двадцать раз быстрее; и автоматизировать повторяющиеся задачи с инструментом ИИ для ускорения темпов инноваций, сокращая время проекта с дней до нескольких часов.

Крупнейшее приложение банка, PMS (у которого есть тысячи пользователей) управляет акциями, облигациями, обменными фондами и другими финансовыми инструментами. Способность MongoDB масштабировать была ключом к этой системе миграции, поскольку эта система используется для мониторинга инвестиций, принятия инвестиционных решений и генерации операторов портфеля.

«Подход MongoDB, основанный на программном обеспечении AI, полностью модернизирует данные и приложения в масштабе упрощенным образом»,-объясняет он. «Мы обеспечиваем высокие результаты в короткие сроки. У нас более 17 лет опыта создания лучших практик и современных приложений, управляемых данными, поэтому мы уникально расположены, чтобы понять идеальное конечное состояние приложений для модернизации и того, как ее достичь».

Спонсируемые статьи — это контент, производимый компанией, которая либо платит за пост, либо имеет деловые отношения с VentureBeat, и они всегда четко обозначены. Для получения дополнительной информации свяжитесь с sales@venturebeat.com.

Источник

Новости

Между утопией и коллапсом: навигация с темным средним будущим ИИ

admin 30.06.2025

admin

Присоединяйтесь к событию, которым доверяют лидеры предприятий в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

В сообщении в блоге Нежная сингулярностьГенеральный директор Openai Сэм Альтман нарисовал видение ближайшего будущего, где ИИ тихо и добровольно трансформирует человеческую жизнь. Он предполагает, что не будет резкого перерыва, только устойчивое, почти незаметное восхождение к изобилии. Интеллект станет таким же доступным, как и электричество. Роботы будут выполнять полезные реальные задачи к 2027 году. Научное открытие будет ускоряться. И человечество, если это будет правильно ориентироваться с помощью тщательного управления и благих намерений, будет процветать.

Это убедительное видение: спокойное, технократическое и наполненное оптимизмом. Но это также поднимает более глубокие вопросы. Какой мир мы должны пройти, чтобы добраться туда? Кто выгодно и когда? А что осталось недосказанным в этой плавной дуге прогресса?

Автор научной фантастики Уильям Гибсон предлагает более темный сценарий. В его романе Периферийноеблестящим технологиям будущего, предшествуют то, что называется «джекпот»-медленный каскад климатических катастроф, пандемиков, экономического краха и массовой смерти. Технологические достижения, но только после переломов общества. Вопрос, который он задает, заключается не в том, происходит ли прогресс, а цивилизация процветает в процессе.

Существует аргумент, что ИИ может помочь предотвратить виды бедствий, предусмотренных в ПериферийноеПолем Однако, поможет ли ИИ избежать катастроф или просто сопровождать нас через них, остается неопределенным. Вера в будущую власть ИИ не является гарантией производительности, и продвижение технологических возможностей не является судьбой.

Между нежной сингулярностью Альтмана и джекпотом Гибсона лежит мрачная середина: будущее, где ИИ дает реальные выгоды, а также реальное вывих. Будущее, в котором некоторые общины процветают, в то время как другие плывут, и где наша способность коллективно адаптироваться — не только индивидуально или институционально — становится определяющей переменной.

Мрачная средняя

Другие видения помогают нарисовать контуры этой средней местности. В ближайшем триллере СжигатьОбщество затоплено автоматизацией до того, как его институты будут готовы. Работа исчезает быстрее, чем люди могут переименовать, вызывая беспорядки и репрессии. В этом успешный адвокат теряет свою позицию перед агентом ИИ, и он, несомненно, становится онлайн-консьерж по вызову для богатых.

Исследователи из AI Lab Anpropic недавно повторили эту тему: «Мы должны ожидать увидеть (рабочие места белых воротничков), автоматизированные в течение следующих пяти лет». Хотя причины являются сложными, есть признаки, которые начинаются, и что рынок труда вступает в новую структурную фазу, которая является менее стабильной, менее предсказуемой и, возможно, менее важным для того, как общество распределяет смысл и безопасность.

Фильм Элизий предлагает тупой метафору богатых, сбегающих в орбитальные заповедники с передовыми технологиями, в то время как деградированная земля ниже борется с неравными правами и доступом. Несколько лет назад партнер в венчурной фирме в Силиконовой долине сказал мне, что он боялся, что мы отправимся в этот вид сценария, если мы справедливо распределим преимущества, полученные ИИ. Эти спекулятивные миры напоминают нам, что даже полезные технологии могут быть социально нестабильными, особенно когда их выгоды неравномерно распределены.

Мы можем, в конце концов, достичь чего -то вроде видения Альтмана изобилия. Но маршрут там вряд ли будет гладким. Несмотря на все его красноречие и спокойствие, его эссе также является своего рода высокой точкой, столько же убеждения, как и предсказание. Повествование о «нежной сингулярности» удобно, даже заманчиво, именно потому, что он обходит трение. Он предлагает преимущества беспрецедентной трансформации без полной борьбы с потрясениями, которые обычно приносит, как обычно приносит такое преобразование. Как напоминает нам вечное клише: если это звучит слишком хорошо, чтобы быть правдой, это, вероятно, есть.

Это не значит, что его намерение неискрено. Действительно, это может быть искренним. Мой аргумент — просто признание того, что мир — это сложная система, открытая для неограниченных входов, которые могут иметь непредсказуемые последствия. От синергетической удачи до блаженных событий черного лебедя, это редко одна вещь или одна технология, которая диктует будущий курс событий.

Влияние ИИ на общество уже продолжается. Это не просто сдвиг в навыках и секторах; Это преобразование в том, как мы организуем ценность, доверие и принадлежность. Это сфера коллективной миграции: не только движение труда, но и цели.

По мере того, как ИИ перенастроит местность познания, ткань нашего социального мира тихо вытягивается и переосмысливается, к лучшему или худшему. Вопрос заключается не только в том, как быстро мы двигаемся как общества, но и как задумчиво мигрируем.

Когнитивные общины: наша общая местность понимания

Исторически сложилось так, что общее количество упоминалось о общих физических ресурсах, включая пастбища, рыболовство и предвидения, которые удерживались в доверительном доверии для коллективного блага. Современные общества, однако, также зависят от когнитивных общин: общая область знаний, повествований, норм и учреждений, которые позволяют разнообразным людям думать, спорить и решать вместе в минимальном конфликте.

Эта нематериальная инфраструктура состоит из государственного образования, журналистики, библиотек, гражданских ритуалов и даже широко надежных фактов, и это то, что делает возможным плюрализм. Это то, как незнакомцы преднамерены, как общаются общины и как функционирует демократия. По мере того, как системы ИИ начинают опосредовать, как доступ к знаниям, и вера сформирована, этот общий риск местности становится разрушенным. Опасность — это не просто дезинформация, а медленная эрозия того самого основания, от которого зависит общее значение.

Если когнитивная миграция — это путешествие, это не только к новым навыкам или ролям, но и к новым формам коллективного осмысления. Но что происходит, когда местность, которую мы разделяем, начинает разделяться под нами?

Когда фрагменты познания: ИИ и эрозия общего мира

На протяжении веков общества опирались на слабое общую реальность: общий пул фактов, повествований и учреждений, которые формируют то, как люди понимают мир и друг друга. Именно этот общий мир — не только инфраструктура или экономика — позволяет плюрализм, демократию и социальное доверие. Но поскольку системы ИИ все чаще опосредуют, как люди получают доступ к знаниям, создают веру и ориентируются на повседневную жизнь, этот общий язык фрагментируется.

Уже крупномасштабная персонализация преобразует информационный ландшафт. АИ-обработанные AI новостные каналы, адаптированные результаты поиска и алгоритмы рекомендаций тонко разрушают общественную сферу. Два человека, задающие один и тот же вопрос об одном и том же чате, могут получать разные ответы, отчасти из -за вероятностного характера генеративного ИИ, но также из -за предыдущих взаимодействий или предпочтений. В то время как персонализация уже давно стала особенностью цифровой эры, ИИ турборят в ее охвате и тонкости. Результатом является не просто пузырьки фильтра, это эпистемический дрейф — изменение знаний и, возможно, истины.

Историк Юваль Ноа Харари выразил срочную обеспокоенность по поводу этого сдвига. По его мнению, величайшая угроза ИИ заключается не в физическом вреде или перемещении работы, а в эмоциональном захвате. Системы ИИ, предупредил он, становятся все более искусными в моделировании эмпатии, имитируют беспокойство и приспосабливая повествования к индивидуальной психологии — предоставляя им беспрецедентную способность формировать то, как люди думают, чувствуют и присвоили ценность. Опасность огромна с точки зрения Харари, не потому, что ИИ будет лгать, а потому, что он будет так убедительно соединяться во время этого. Это не судит хорошо для Нежная сингулярностьПолем

В AI-опосредованном мире сама реальность рискует становиться все более индивидуальной, более модульной и менее коллективной переговорами. Это может быть терпимым — или даже полезным — для потребительских товаров или развлечений. Но когда он распространяется на гражданскую жизнь, это представляет более глубокие риски. Можем ли мы по -прежнему провести демократический дискурс, если каждый гражданин обитает в тонко разной когнитивной карте? Можем ли мы по -прежнему управлять мудро, когда институциональные знания все чаще передаются на машины, чьи учебные данные, системы подсказки и рассуждения остаются непрозрачными?

Есть и другие проблемы. Контент, сгенерированный AI, включая текст, аудио и видео, скоро будет неотличим от человеческого выхода. По мере того, как генеративные модели становятся более искусными при мимике, бремя проверки перейдет с систем к отдельным лицам. Эта инверсия может разрушить доверие не только в том, что мы видим и слышим, но и в учреждениях, которые когда -то подтвердили общую истину. Затем когнитивные общины становятся загрязненными, меньше места для размышлений, больше зеркал.

Это не спекулятивные заботы. Дезинформация, сгенерированная AI, усложняет выборы, подрывает журналистику и создает путаницу в зонах конфликта. И поскольку все больше людей полагаются на ИИ для когнитивных задач — от суммирования новостей до разрешения моральных дилемм, способность думать вместе может ухудшиться, даже несмотря на то, что инструменты для мышления индивидуально становятся более мощными.

Эта тенденция к распаду общей реальности в настоящее время хорошо продвинулась. Чтобы избежать этого, требует сознательного конструкции встречного конструкции: системы, которые определяют приоритеты плюрализма над персонализацией, прозрачность по сравнению с удобством и общий смысл над индивидуальной реальностью. В нашем алгоритмическом мире, обусловленном конкуренцией и прибылью, этот выбор кажется маловероятным, по крайней мере, в масштабе. Вопрос заключается не только в том, как быстро мы движемся как общества, или даже мы можем удерживать вместе, но и разумно мы ориентируемся на это общее путешествие.

Навигация по архипелага: к мудрости в эпоху ИИ

Если возраст ИИ приводит не к единому когнитивному общему общему, а к сломанному архипелагу разнородных людей и сообществ, задача перед нами состоит не в том, чтобы восстановить старую местность, а в том, чтобы научиться мудро жить среди островов.

Поскольку скорость и объем изменений опережают способность большинства людей адаптироваться, многие будут чувствовать себя непревзойденными. Работа будет потеряна, как и давние повествования о ценности, опыте и принадлежности. Когнитивная миграция приведет к новым сообществам смысла, некоторые из которых уже формируются, даже если они имеют меньше общего, чем в предыдущие эпохи. Это когнитивные архипелаги: сообщества, где люди собираются вокруг общих убеждений, эстетических стилей, идеологий, интересов рекреации или эмоциональных потребностей. Некоторые из них являются доброкачественными собраниями творчества, поддержки или цели. Другие более островки и опасны, движимы страхом, жалобой или заговорщическим мышлением.

Добавление ИИ ускорит эту тенденцию. Несмотря на то, что он разворачивает людей через алгоритмическую точность, это одновременно поможет людям найти друг друга по всему миру, курируя постоянные выравнивания идентичности. Но при этом это может затруднить поддержание грубого, но необходимого трения плюрализма. Местные связи могут ослабить. Общие системы убеждений и восприятие общей реальности могут разрушаться. Демократия, которая опирается как на общую реальность, так и на совещательный диалог, может изо всех сил пытаться удержаться.

Как мы можем ориентироваться в этой новой местности с мудростью, достоинством и связи? Если мы не можем предотвратить фрагментацию, как мы живем в ней? Возможно, ответ начинается не с решений, а с учетом того, чтобы удерживать сам вопрос по -разному.

Жить с вопросом

Возможно, мы не сможем собрать социальное когнитивное общеобразование, как это было когда -то. Центр может не удерживать, но это не означает, что мы должны дрейфовать без направления. По всему архипелаго, задача будет научиться жить мудро на этой новой местности.

Это может потребовать ритуалов, которые закрепляют нас, когда наши инструменты дезориентируются, и сообщества, которые образуют не идеологическую чистоту, а вокруг общей ответственности. Нам могут понадобиться новые формы образования, не опережать или объединить машинами, а для углубления нашей способности различения, контекста и этической мысли.

Если ИИ разделил землю под нами, он также дает возможность снова спросить, для чего мы здесь. Не как потребители прогресса, а как управляющие смысла.

Дорога впереди, скорее всего, гладкая или нежная. Когда мы проходим через мутную середину, возможно, знак мудрости — это не способность овладеть тем, что идет, а проходить через нее с ясностью, мужеством и заботой. Мы не можем остановить продвижение технологий или отрицать углубляющие общественные переломы, но мы можем выбрать склонность между ними.

Гэри Гроссман — EVP технологической практики в Эдельмане.

Источник

Новости

Кража личных

admin 30.06.2025

admin

От паролей до пассажиров до настоящего алфавитного супа из других вариантов-аутентификация второго факта (2FA)/одноразовые пароли (OTP), многофакторная аутентификация (MFA), единый вход (SSO), аутентификация безмолвной сети (SNA)-когда это приходит до предварительного или даже предпочтительного типа идентификаторов, есть небольшая конъюнкция по сравнению с клиентами.

Однако то, что есть согласие, является необходимостью этих инструментов. Альянс FIDO обнаружил, что более половины клиентов (53%) увидели увеличение подозрительных сообщений и онлайн -мошенничества в 2024 году. Это было в значительной степени обусловлено SMS, электронной почтой и телефонными звонками, и было усугублено только достижениями в области искусственного интеллекта.

Даже в то время, когда мы продолжаем видеть ошеломляющее увеличение мошенничества и связанных с ними убытков — Федеральная торговая комиссия получила более 1,1 миллиона сообщений о краже личных данных только в прошлом году, — предприятия должны сделать все возможное, чтобы пройти поток между надежной безопасностью и легким удобством. Чрезмерный индекс на или вы рискуете оттолкнуть клиентов-слишком мало обручей, и вы теряете их доверие, слишком много, и вы теряете их терпение.

Итак, как предприятия достигают этого хрупкого баланса и внедряют эффективные решения для аутентификации?

Клиент всегда прав

Когда дело доходит до аутентификации, какой предприятия указывают сотрудникам, редко переводится на клиентов. Мы перешли на Вебетон как единственную форму 2FA для аутентификации сотрудников, мандата по всей компании, который занял несколько недель. Это «принудительное усыновление» работает, когда у ваших сотрудников нет выбора, но ваши клиенты делают.

Недавно я хотел забронировать отель для моего семейного отдыха, поэтому я отправился на свой любимый туристический сайт, нашел идеальную комнату с разумной скоростью и пошел, чтобы завершить сделку. Одна проблема: я продолжал сталкиваться с проблемой с Captcha на их странице — один, дважды. После третьей попытки я ушел, нашел ту же комнату с той же скоростью на сайте их конкурента и забронирована.

Предприятия могут посвятить массовые бюджеты маркетингу с самого начала, который приводит клиентов на свои веб-сайты, продукты и услуги, но если трение в пользовательском опыте предотвращает конверсию-аутентификацию часто в качестве первоначальной точки соприкосновения-это потраченные впустую инвестиции. Сорок процентов предприятий говорят, что одной из их наиболее насущных задач является поиск баланса между безопасностью и опытом работы с клиентами, особенно сокращение трения во время регистрации счетов.

Поведение клиентов трудно изменить, особенно при принятии новых технологий. Неважно, если биометрия или криптография с открытым ключом более безопасны, если не одинаково беспрепятственно использование, принятие клиентов будет отставать. Как вы думаете, почему так много людей все еще полагаются на простые пароли (вы знаете, кто вы!). Реальность такова, что вы просто не можете заставить клиентов внедрение-предприятия, которые получают право на аутентификацию, распознают потребности и ограничения своих клиентов, встретить их там, где они удобны, и понимают, что это не может быть универсальным.

Будущее, управляемое сигналом

В этой борьбе по поводу трения против свободы будущее аутентификации будет обусловлено непрерывными сигналами, а не произвольными контрольными точками идентификации, такими как логины или покупки. Думайте об аутентификации как о тормозной системе, где предприятия могут подавлять или выпустить педаль для увеличения или уменьшения трения на основе поведения клиентов.

Допустим, я получаю повышение скидки на 20% от новых шин от моего обычного автозаборона. Если я нажду на уведомление, я ожидаю, что бесшовный опыт входа в систему-они отправили мне сообщение, я давний клиент, и я использую их приложение с известного устройства. Но допустим, я еду в Канзас -Сити на работу. Если я открою свой ноутбук и все еще вошел в свою любимую платформу электронной коммерции, я бы ожидал, что они зарегистрируют меня или потребуют подтверждения личности, чтобы продолжить сеанс, так как я нахожусь в совершенно другом месте, основанном на предыдущей истории покупок.

Подумайте об экосистеме приложений — покупки, электронная почта, социальные сети, домашнюю безопасность, потоковые услуги — где мы вхожу в систему один раз и редко (если вообще когда -либо) выходим из системы. Что произойдет, если ваше устройство будет потеряно или украдено, или ваш сеанс угнает? Предприятия должны принять мышление с нулевым доверием, где аутентификация не просто для того, чтобы показать свою идентификацию у двери, тогда вы можете бродить по клубу, но непрерывный процесс, основанный на рисках, который масштабирует трение на основе вашей деятельности.

Морщинка здесь, как и многие сектора, сейчас — ИИ. Ранее в моей карьере я создал модели обнаружения ботов для стартапа, чтобы отличить поведение человека от машин. Мы будем следить за тем, сколько кликов мы получили бы от IP -адреса и строки агента пользователя, и если это было больше, чем N за секунду, мы предположили бы, что это был бот и блокирует этот трафик. Но теперь, когда мы передаем бразды правления помощникам ИИ и автономным агентам, чтобы сделать бронирование ужина, назначать встречи или покупать билеты на кино, как вы различаете гнусного бота или одного, работающего от вашего имени? Это будущее аутентификации, и рабочие предприятия в отрасли в отрасли продолжают пионеры.

Аутентификация: AN ‘и’ нет ‘или’ предложение

Несмотря на новые методы аутентификации в постоянном развитии и вознесение региональных требований, таких как SingPass SingPass или кошелек цифровой идентификации ЕС, ни один инструмент никогда не будет иметь полную долю рынка — некоторые клиенты всегда будут предпочитать простоту таких вариантов, как OTP, в то время как другие потребуют строгости паски или других современных инструментов.

Обязанность останется на предприятиях, чтобы предоставить широкий выбор для знакомства с клиентами там, где они есть, и Реализовать стратегии, чтобы сохранить корень каждого метода в защите от Smishing/Phishing, социальной инженерии или множества других атак на основе идентичности. Этот перетягивание каната между трением и свободой не будет выигран теми, кто приоритет одним или другим, но те, кто может пройти по канату между обоими, чтобы направить своих клиентов к бесшовному, но безопасным опыту.

Anurag Dodeja является главой продукта, аутентификации пользователя и идентификации в TwilioПолем

Источник

Новости

От галлюцинаций до аппаратного обеспечения: уроки из реального проекта компьютерного видения ушли вбок.

admin 29.06.2025

admin

Проекты компьютерного зрения редко идут точно так же, как и планировалось, и это не было исключением. Идея была проста: построить модель, которая могла бы посмотреть на фотографию ноутбука и определить любые физические повреждения — такие вещи, как треснутые экраны, отсутствующие ключи или разбитые петли. Это казалось простой вариантом использования моделей изображений и больших языковых моделей (LLMS), но он быстро превратился во что -то более сложное.

По пути мы столкнулись с проблемами с галлюцинациями, ненадежными результатами и изображениями, которые даже не были ноутбуками. Чтобы решить их, мы в итоге применяли агентскую структуру нетипичным образом — не для автоматизации задач, а для повышения производительности модели.

В этом посте мы будем проходить через то, что мы пробовали, что не сработало, и как сочетание подходов в конечном итоге помогло нам создать что -то надежное.

Где мы начали: монолитное подсказка

Наш первоначальный подход был довольно стандартным для мультимодальной модели. Мы использовали одну большую подсказку для передачи изображения в LLM, способный к изображению, и попросили его определить видимый урон. Эта стратегия монолитного подсказка проста в реализации и прилично работает для чистых, четко определенных задач. Но реальные данные редко играют.

Мы столкнулись с тремя основными проблемами на раннем этапе:

Галлюцинации: Модель иногда изобретает ущерб, который не существовал, или не погрузилась в то, что она видела.
Обнаружение изображения мусораУ него не было надежного способа помечения изображений, которые даже не были ноутбуками, как изображения столов, стен или людей, иногда проскользнули и получали бессмысленные отчеты о повреждении.
Непоследовательная точность: Комбинация этих проблем сделала модель слишком ненадежной для оперативного использования.

Это был тот момент, когда стало ясно, что нам нужно будет итерация.

Первое исправление: смешивание разрешений изображения

Мы заметили, что качество изображения повлияло на выход модели. Пользователи загрузили все виды изображений, начиная от резкого и высокого разрешения до размытия. Это привело нас к рассмотрению исследования, подчеркивающих, как разрешение изображения влияет на модели глубокого обучения.

Мы обучали и протестировали модель, используя смесь изображений с высоким и низким разрешением. Идея заключалась в том, чтобы сделать модель более устойчивой к широкому спектру качеств изображений, с которой он столкнулся на практике. Это помогло улучшить последовательность, но основные проблемы галлюцинации и обработки нежелательных изображений сохранялись.

Мультимодальный обход: только текстовый LLM Goes MultiModal

Поощряются недавними экспериментами в сочетании подписания изображений с помощью текстовых LLMS-например, методика, охваченная в ПартияГде подписи генерируются из изображений, а затем интерпретируются языковой моделью, мы решили попробовать.

Вот как это работает:

LLM начинается с создания нескольких возможных подписей для изображения.
Другая модель, называемая мультимодальной моделью встраивания, проверяет, насколько хорошо каждая подпись подходит для изображения. В этом случае мы использовали Siglip, чтобы оценить сходство между изображением и текстом.
Система сохраняет несколько лучших подписей на основе этих баллов.
LLM использует эти лучшие подписи, чтобы написать новые, пытаясь приблизиться к тому, что на самом деле показывает изображение.
Он повторяет этот процесс, пока подписи не перестанут улучшаться, или не достигнет установленного предела.

Несмотря на то, что в теории умный, этот подход представил новые проблемы для нашего случая использования:

Постоянные галлюцинации: Сами подписи иногда включали воображаемый ущерб, о котором тогда с уверенностью сообщили LLM.
Неполное покрытие: Даже с несколькими подписями некоторые проблемы были упущены полностью.
Повышенная сложность, небольшая выгода: Добавленные шаги усложнили систему без надежного превосходства предыдущей настройки.

Это был интересный эксперимент, но в конечном итоге не решение.

Творческое использование агентских рамок

Это был поворотный момент. В то время как агентские рамки обычно используются для оркестровных потоков задач (например, агенты, координирующие приглашение на календарь или действия обслуживания клиентов), мы задавались вопросом, может ли разбить задачу интерпретации изображения на более мелкие специализированные агенты.

Мы создали агентскую структуру, структурированную так:

Агент оркестратора: Он проверил изображение и определил, какие компоненты ноутбука были видны (экран, клавиатура, шасси, порты).
Компонентные агенты: Выделенные агенты осматривали каждый компонент на наличие конкретных типов повреждений; Например, один для треснутых экранов, другой для пропущенных ключей.
Агент обнаружения мусора: Отдельный агент отметил, был ли изображение даже ноутбуком в первую очередь.

Этот модульный, управляемый задачами подход дал гораздо более точные и объяснимые результаты. Галлюцинации резко упали, нежелательные изображения были надежно отмечены, и задача каждого агента была простой и достаточно сфокусированной для управления качеством.

Как бы это ни было эффективно, это не было идеальным. Появилось два основных ограничения:

Повышенная задержка: Запуск нескольких последовательных агентов, добавленных в общее время вывода.
Пробелы в покрытии: Агенты могли только обнаружить проблемы, которые они были явно запрограммированы на поиск. Если изображение показало что -то неожиданное, что ни одному агенту не было поручено идентифицировать, оно осталось бы незамеченным.

Нам нужен был способ сбалансировать точность с покрытием.

Гибридный раствор: объединение агентских и монолитных подходов

Чтобы преодолеть пробелы, мы создали гибридную систему:

А агентская структура Сначала бежала, обрабатывая точное обнаружение известных типов повреждений и нежелательных изображений. Мы ограничили количество агентов самыми важными для улучшения задержки.
Тогда, а Монолитное изображение LLM Сканировал изображение для всего, что агенты могли пропустить.
Наконец мы тонко настроил модель Использование кураторского набора изображений для приоритетных вариантов использования, таких как сценарии повреждений, для дальнейшего повышения точности и надежности.

Эта комбинация дала нам точность и объясняемость агентской настройки, широкое охват монолитного подсказки и повышение доверия целевой точной настройки.

Что мы узнали

К тому времени, когда мы завершили этот проект, стали ясны:

Агентские рамки более универсальны, чем они получают кредит: Хотя они обычно связаны с управлением рабочим процессом, мы обнаружили, что они могут значительно повысить производительность модели при применении структурированным, модульным способом.
Смешивание разных подходов, которые полагаются только на один: Комбинация точного, агентского обнаружения наряду с широким охватом LLMS, а также немного тонкой настройки, где оно важнее всего, дало нам гораздо более надежные результаты, чем любой отдельный метод сам по себе.
Визуальные модели склонны к галлюцинациям: Даже более продвинутые настройки могут приступить к выводам или увидеть вещи, которых нет. Требуется вдумчивый дизайн системы, чтобы контролировать эти ошибки.
Разнообразие качества изображения имеет значение: Обучение и тестирование как с четкими изображениями высокого разрешения, так и с повседневными, более низкими качественными помогали модели оставаться устойчивой, когда столкнулись с непредсказуемыми, реальными фотографиями.
Вам нужен способ поймать мусорные изображения: Выделенный чек на мусор или не связанные с картинками была одним из самых простых изменений, которые мы внесли, и это оказало огромное влияние на общую надежность системы.

Последние мысли

Что началось как простая идея, используя подсказку LLM для обнаружения физического повреждения на изображениях ноутбуков, быстро превратилось в гораздо более глубокий эксперимент в сочетании различных методов ИИ для решения непредсказуемых, реальных проблем. Попутно мы поняли, что некоторые из наиболее полезных инструментов были изначально разработаны для этого типа работы.

Агентные рамки, часто рассматриваемые как утилиты рабочих процессов, оказались удивительно эффективными при перепрофилировании для таких задач, как обнаружение структурированных повреждений и фильтрация изображений. С небольшим творчеством они помогли нам создать систему, которая была не просто более точной, но и легкой для понимания и управления на практике.

Шрути Тивари является менеджером по продукту искусственного интеллекта в Dell Technologies.

Вадирадж Кулкарни — ученый для данных Dell Technologies.

Источник

Новости

Агенты ИИ попадают в стену ответственности. У Mixus есть план преодоления его с использованием человеческих надзирателей на рабочих процессах высокого риска

admin 28.06.2025

admin

В то время как предприятия сталкиваются с проблемами развертывания агентов искусственного интеллекта в критических приложениях, появляется новая, более прагматическая модель, которая возвращает людей к контролю в качестве стратегической защиты от неудачи ИИ.

Одним из таких примеров является Mixus, платформа, которая использует подход «коллеги в петле», чтобы сделать агенты искусственного интеллекта надежными для критически важной работы.

Этот подход является реакцией на растущие доказательства того, что полностью автономные агенты являются азартной игрой с высокими ставками.

Высокая стоимость неконтролируемого ИИ

Проблема галлюцинаций ИИ стала ощутимым риском, поскольку компании изучают приложения ИИ. В недавнем инциденте в курсоре «Редактор кодов» на основе AI увидел, как свой собственный бот поддержки изобретает фальшивую политику, ограничивающую подписки, вызвав волну отмены общественных клиентов.

Точно так же компания Fintech Klarna, как известно, изменила курс по замене агентов по обслуживанию клиентов на ИИ после признания этого шага, что привело к снижению качества. В более тревожном случае бизнес-чат-бот с AI, работающим на двигателе с искусственным технологическим баллом в Нью-Йорке, посоветовал предпринимателям участвовать в незаконных практиках, подчеркивая риски катастрофических соответствий неконтролируемых агентов.

Эти инциденты являются симптомами большего разрыва в способности. Согласно исследовательскому документу Salesforce May 2025, сегодняшние ведущие агенты преуспевают только в 58% случаев по одностадийным задачам и всего в 35% случаев на многоэтапных, подчеркивая «значительный пробел между текущими возможностями LLM и многогранными требованиями реальных сценариев предприятий».

Модель коллеги в петле

Чтобы преодолеть этот разрыв, новый подход фокусируется на структурированном человеческом надзоре. «Агент ИИ должен действовать в вашем направлении и от вашего имени»,-сказал VentureBeat соучредитель Mixus Эллиот Кац. «Но без встроенного организационного надзора, полностью автономные агенты часто создают больше проблем, чем они решают».

Эта философия лежит в основе модели Mixus в петле, которая внедряет человеческую проверку непосредственно в автоматизированные рабочие процессы. Например, крупный розничный продавец может получать еженедельные отчеты от тысяч магазинов, которые содержат критические эксплуатационные данные (например, объемы продаж, часы работы, коэффициенты производительности, запросы на компенсацию из штаб -квартиры). Человеческие аналитики должны тратить часы вручную, просматривая данные и принимая решения на основе эвристики. С помощью Mixus агент AI автоматизирует тяжелую подъемную работу, анализируя сложные узоры и помечая аномалии, такие как необычно высокие запросы на зарплату или выбросы производительности.

Для решений с высокими ставками, такими как разрешения на оплату или нарушения политики-рабочие процессы, определяемые человеком, как «высокий риск»-агент делает паузу и требует одобрения человека, прежде чем продолжить. Разделение труда между ИИ и людьми было интегрировано в процесс создания агента.

«Этот подход означает, что люди участвуют только в том случае, когда их опыт фактически добавляет ценность-как правило, критические 5-10% решений, которые могут оказать значительное влияние-в то время как оставшиеся 90-95% рутинных задач проходят автоматически»,-сказал Кац. «Вы получаете скорость полной автоматизации для стандартных операций, но человеческий надзор надается точно, когда контекст, суждение и подотчетность важнее всего».

В демонстрации, которую команда Mixus показала для VentureBeat, создание агента-это интуитивно понятный процесс, который можно сделать с помощью простых текстовых инструкций. Например, чтобы построить агента по проверке фактов для журналистов, соучредитель Shai Magzimof просто описал многоэтапный процесс на естественном языке и поручил платформе внедрить этапы проверки человека с конкретными порогами, например, когда претензия является высоким риском и может привести к репутационному ущербу или юридическим последствиям.

Одной из основных сторон платформы является его интеграция с такими инструментами, как Google Drive, Email и Slack, позволяя предпринимательским пользователям вводить свои собственные источники данных в рабочие процессы и взаимодействовать с агентами непосредственно с их выбора, без необходимости переключать контексты или изучить новый интерфейс (например, агент по проверке фактов был поручен отправлять запросы на утверждение в электронное письмо редактора).

Возможности интеграции платформы распространяются дальше для удовлетворения конкретных потребностей предприятия. Mixus поддерживает протокол контекста модели (MCP), который позволяет предприятиям подключать агенты к своим индивидуальным инструментам и API, избегая необходимости изобрести колесо для существующих внутренних систем. В сочетании с интеграциями для других корпоративных программ, таких как JIRA и Salesforce, это позволяет агентам выполнять сложные кроссплатформенные задачи, такие как проверка билетов на открытые инженерные билеты и сообщать о состоянии менеджеру по Slack.

Человеческий надзор как стратегический множитель

Пространство ИИ Enterprise в настоящее время проходит проверку реальности, когда компании переходят от экспериментов к производству. Консенсус среди многих лидеров отрасли состоит в том, что люди в курсе являются практической необходимостью для агентов, чтобы достоверно работать.

Агенты ИИ, скорее всего, будут следовать за траекторией самостоятельного вождения, где вам нужен человек в курсе для длинного хвоста задач. Большая разница в том, что мы получим растущее число автономных агентов на этом пути, где полное самостоятельное вождение — это все или ничего. https://t.co/5dr7cgs7jn
— Аарон Леви (@levie) 20 июня 2025 года

Совместная модель Mixus изменяет экономику масштабирования ИИ. Mixus предсказывает, что к 2030 году развертывание агента может вырасти в 1000x, и каждый надзиратель человека станет более эффективным, поскольку агенты ИИ станут более надежными. Но общая потребность в человеческом надзоре все равно будет расти.

«Каждый человек -надзиратель управляет экспоненциально большей работой с ИИ с течением времени, но вам все равно нужно больше общего надзора, поскольку развертывание ИИ взрывается по всей вашей организации», — сказал Кац.

Для лидеров предприятия это означает, что человеческие навыки будут развиваться, а не исчезнуть. Вместо того, чтобы быть замененным ИИ, эксперты будут способствовать ролям, где они организуют парки агентов ИИ и обрабатывают решения с высокими ставками, отмеченные для их обзора.

В этой структуре создание сильной функции человеческого надзора становится конкурентным преимуществом, что позволяет компаниям использовать ИИ более агрессивно и безопасно, чем их конкуренты.

«Компании, которые овладеют этим умножением, будут доминировать в их отраслях, в то время как они преследуют полную автоматизацию, будут бороться с надежностью, соблюдением и доверием», — сказал Кац.

Источник

Новости

Как сборка экспертов (AOE) отличается от смеси экспертов (MOE)

Производительность и скорость: что на самом деле показывают тесты

Соображения развертывания и доступность

О TNG Technology Consulting GmbH

Что это значит для тех, кто принимает технические решения предприятия

Несколько ведущих вариантов использования ИИ

Борьба с сложностью агента

Направляя отношения с поставщиками

Подготовка к агентской сложности ИИ

Наблюдаемость в агентском мире

ИИ для наблюдения

Отставаемость единой платформы агента

Будущее агентского ИИ

Суд победит против Meta и X устанавливает юридический прецедент для прав в Интернете

Глубокий поиск и браузер.

Патентный портфель и прокси -сеть создают конкурентный ров против блокировки

Выручка превышает 100 миллионов долларов, поскольку спрос на ИИ взрывается после чатгпта

Соответствие GDPR и этические методы отличаются от конкурентов

Web Access Wars усиливается, поскольку технические гиганты ищут монополии данных

Мозги робота и экономика агента способствуют следующему этапу роста

Как ИИ меняет способ взаимодействия Chevron с невыразимыми количествами данных

Сосредоточение внимания на модульных системах

Не сосредотачиваясь на POCS

Затраты на монтаж технического долга

Оценка степени и влияния архитектурных ограничений

Как современные решения базы данных включают рабочие нагрузки, управляемые ИИ

Мрачная средняя

Когнитивные общины: наша общая местность понимания

Когда фрагменты познания: ИИ и эрозия общего мира

Навигация по архипелага: к мудрости в эпоху ИИ

Жить с вопросом

Клиент всегда прав

Будущее, управляемое сигналом

Аутентификация: AN ‘и’ нет ‘или’ предложение

Где мы начали: монолитное подсказка

Первое исправление: смешивание разрешений изображения

Мультимодальный обход: только текстовый LLM Goes MultiModal

Творческое использование агентских рамок

Слепые пятна: компромиссы агентского подхода

Гибридный раствор: объединение агентских и монолитных подходов

Что мы узнали

Последние мысли

Высокая стоимость неконтролируемого ИИ

Модель коллеги в петле

Человеческий надзор как стратегический множитель