Автор

admin

admin

Обзор сервисов

ChatGPT Agent

admin 17.07.2025

admin

В середине июля 2025 года OpenAI представила долгожданную функцию ChatGPT Agent (ранее известную как Agent Mode) — мультиагентную систему, которая способна выполнять сложные задачи, используя свой “виртуальный компьютер”. Это важный шаг к созданию инструментов уровня J.A.R.V.I.S из «Железного человека», способных не только анализировать, но и активно действовать.

YouTube

Содержание

Что это и как работает 🤖
История развития
Примеры использования
Для кого и где доступно
Безопасность и ограничения
Позиционирование на рынке
Заключение

Что это и как работает 🤖

История развития

OpenAI начинала с двух отдельных инструментов:

Operator — агент, умеющий открывать браузер, кликать, скроллить, заполнять формы и делать заказы
Deep Research — инструмент автономного исследования, анализирующий информацию из множества источников и готовящий отчёты

Теперь обе функции объединены в ChatGPT Агента, снабжённый моделью Computer-Using Agent (CUA) и механизмами глубокого исследования. Агент может запускать код, перемещаться по сайтам и готовить отчёты — всё под вашим контролем.

Примеры использования

Анализ календаря и составление резюме встреч на основе новостей.
Планирование рецептов и покупка ингредиентов через интернет-магазин.
Сравнение конкурентов и формирование презентационного слайд‑дека.

Агент запрашивает ваше разрешение перед критическими действиями и поддерживает прерывание и вмешательство на любом этапе.

Для кого и где доступно

Функция уже доступна пользователям с подписками Pro, Plus и Team через интерфейс ChatGPT — простой выбор опции “agent mode” в меню инструментов. В ближайшее время доступ планируется расширить на Enterprise и Education, за исключением регионов ЕС и Швейцарии.

Безопасность и ограничения

OpenAI ввела режим Watch Mode для финансовых операций и продвинула биобезопасные фильтры. При этом агент работает медленнее, чем обычный чат, но экономит время при сложных задачах.

Тем не менее, он может ошибаться при работе с сложными интерфейсами и длительными стратифицированными шагами, а браузерные действия имеют ограничения в специфичных сценариях.

Позиционирование на рынке

– Против Google, Microsoft, Meta: Agent Mode прямо конкурирует с офисными ассистентами от Microsoft и Google.
– Вектор развития: Генерация текста превращается в агентскую автоматизацию — AI теперь может полноценно действовать системно.
– Бизнес и исследователи: OpenAI развивается в сторону создания платформы для пользовательских агентов, особенно для корпоративного использования.

Заключение

ChatGPT Agent — это эволюционный шаг от консалтинга к действию. Если вы работаете с массой данных, планируете задачи, ведёте исследовательские проекты или хотите автоматизировать онлайн-процессы — Agent Mode станет мощным инструментом. Вопрос остаётся один: насколько далеко OpenAI сможет продвинуть способность агентов решать задачи вместо человека?

Рекомендации:

Используйте Agent Mode для рутинных или многоэтапных задач (финансовые отчёты, планирование, исследования).
Постоянно проверяйте промежуточные результаты — агент может допускать ошибки.
Следите за расширением доступности — Enterprise и Educational-планы обещают значительное расширение диапазона применения.

Источник

Доходы от кода Claud

admin 17.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Anpropic объявил сегодня, что он разрабатывает комплексную аналитическую панель для своей помощника по программированию Claude Code AI, решает одну из самых насущных проблем для лидеров корпоративных технологий: понимание того, фактически окупаются их инвестиции в инструменты кодирования искусственного интеллекта.

Новая панель инструментов предоставит инженерным менеджерам подробные показатели того, как их команды используют Claude Code, включая принятые строки кода, показатели приема предложений, общие активности пользователя с течением времени, общие расходы с течением времени, средние ежедневные расходы для каждого пользователя и средние ежедневные строки кода, принятые для каждого пользователя. Эта функция появляется в качестве компаний, которые все чаще требуют конкретных данных, чтобы оправдать свои расходы искусственного интеллекта среди более широкого стремления к измерению доходности искусственного интеллекта на инвестиции.

«Когда вы наблюдаете за большой инженерной командой, вы хотите знать, что делают все, и это может быть очень сложно», — сказал Адам Вольф, который управляет командой Claud Code в Антрике и ранее занимал должность руководителя инженерии в Робинстве. «Трудно измерить, и мы видели несколько стартапов в этом пространстве, пытающихся решить это, но важно получить представление о том, как люди используют инструменты, которые вы им даете».

Диастерная панель рассматривает фундаментальную проблему, с которыми сталкиваются технологические руководители: поскольку инструменты разработки на основе AI становятся стандартными в разработке программного обеспечения, менеджеры не имеют видимости, в которой команды и частные лица получают больше всего выгодно от этих дорогих премиальных инструментов. Ценообразование Claude Code начинается с 17 долларов в месяц для отдельных разработчиков, а корпоративные планы достигают значительно более высоких цен.

Скриншот новой аналитической панели Analytics для Claude для Claude Code показывает метрики использования, данные о тратях и индивидуальную деятельность разработчика для команды инженеров в течение месяца. (Кредит: антроп)

Компании требуют, чтобы их инвестиции в кодирование искусственного интеллекта работают

Это отмечает одну из самых запрашиваемых функций Anpropic от корпоративных клиентов, сигнализируя о более широком корпоративном аппетите для инструментов подотчетности искусственного интеллекта. Панель инструментов будет отслеживать коммиты, привлекать запросы и предоставлять подробные поломки деятельности пользователями и затратами — данные, которые, как говорят инженерные лидеры, имеют решающее значение для понимания того, как ИИ меняет рабочие процессы разработки.

«Разные клиенты на самом деле хотят делать разные вещи с этой стоимостью», — объяснил Вольф. «Некоторые были похожи на, эй, я хочу потратить столько, сколько смогу на эти инструменты для обеспечения искусственного искусства, потому что они видят в этом множитель. Некоторые, очевидно, разумно хотят убедиться, что они не взорвут свои расходы».

Эта функция включает в себя элементы управления доступа на основе ролей, что позволяет организациям настроить, кто может просматривать данные об использовании. Вольф подчеркнул, что система фокусируется на метаданных, а не на фактическом содержании кода, устраняя потенциальные проблемы конфиденциальности в отношении наблюдения за сотрудниками.

«Это не содержит никакой информации о том, что люди на самом деле делают», — сказал он. «Это скорее мета, например, сколько они используют ее, вы знаете, как, например, какие инструменты работают? Какую скорость принятия инструментов вы видите — вещи, которые вы бы использовали, чтобы настроить свое общее развертывание».

Код Claud

Запуск на панели панели наступает на фоне необычайного роста для Claude Code, так как Anpropic представила свои модели Claude 4 в мае. Согласно данным компании, на платформе на платформе наблюдается рост активной базы пользователей на 300%, а увеличение выручки-более 5,5 раза-более 5,5 раз.

«Claude Code находится в броске», — сказал Вольф Venturebeat. «Мы видели рост дохода в пять с половиной раза с тех пор, как в мае мы запустили модели Claude 4. Это дает вам ощущение потока спроса, которое мы видим».

Список клиентов включает в себя известные технологические компании, такие как Figma, Rakuten и Intercom, представляющие сочетание инструментов дизайна, платформ электронной коммерции и поставщиков технологий обслуживания клиентов. Вольф отметил, что многие дополнительные корпоративные клиенты используют Claude Code, но еще не предоставил разрешение на публичное раскрытие.

Траектория роста отражает более широкий импульс отрасли вокруг помощников по кодированию искусственного интеллекта. Копилот Github, инструмент программирования Microsoft, национальный AI, собрал миллионы пользователей, в то время как новые участники, такие как Cursor и недавно приобретенные Windsurf, получили тягу среди разработчиков, стремящихся к более мощной помощи ИИ.

Стратегия ценообразования премиум

Claude Code позиционирует себя как предприятие премиального предприятия на все более многолюдном рынке инструментов кодирования ИИ. В отличие от некоторых конкурентов, которые сосредоточены в первую очередь на завершении кода, Claude Code предлагает то, что антропические вызовы «агентские» возможности — возможность понимать целые кодовые базы, вносить скоординированные изменения в нескольких файлах и работать непосредственно в существующих рабочих процессах разработки.

«Это не дешево. Это премиум -инструмент», — сказал Вольф. «Покупатель должен понимать, что он получает за это. Когда вы видите эти метрики, довольно ясно, что разработчики используют эти инструменты, и они делают их более продуктивными».

Компания нацелена на организации с выделенными группами AI и существенными операциями по развитию. Вольф сказал, что наиболее технические компании являются ведущими ведущими внедрением, особенно с внутренними командами, сосредоточенными на интеграции искусственного интеллекта.

«Конечно, компании, у которых есть свои собственные команды по обеспечению эффективности искусственного интеллекта, они любят код Клода, потому что он настолько настраивается, что его можно развернуть с правильным набором инструментов и подсказок и разрешений, которые очень хорошо работают для их организации», — пояснил он.

Традиционные отрасли с крупными командами разработчиков проявляют растущий интерес, хотя сроки усыновления остаются дольше, поскольку эти организации ориентируются на процессы закупок и стратегии развертывания.

Ассистент Ай -кодирования рынка нагревается, когда технические гиганты сражаются за разработчиков

Аналитическая панель инструментов ставит антропную конкуренцию с обратной связью с предприятиями по поводу измерения эффективности инструмента ИИ — задачи, стоящей перед всем рынком ассистента по кодированию ИИ. В то время как конкуренты, такие как Github Copilot и новые участники, сосредоточены главным образом на производительности отдельных разработчиков, Anpropic делает ставку на то, что корпоративные клиенты нуждаются в комплексной организационной информации.

Amazon недавно запустила Kiro, собственную среду кодирования Claude, подчеркивая растущую конкуренцию в инструментах разработки искусственного интеллекта. Microsoft продолжает расширять возможности Github Copilot, в то время как Google только что приобретает нанятого генерального директора Windsurf Varun Mohan и членов команды ключевых сделок в размере 2,4 миллиарда долларов, чтобы поддержать свои усилия по агентскому кодированию.

Вольф считает, что на рынке есть место для нескольких решений, отмечая, что многие разработчики используют несколько инструментов кодирования ИИ в зависимости от конкретных задач. «Люди, которые сейчас делают лучше всего, — это те, кто пробует все и использует точно правильный инструмент для работы», — сказал он.

Автономные агенты ИИ могут изменить то, как строится программное обеспечение

Помимо немедленных показателей производительности, Вольф видит Код Клода как часть более широкого сдвига в сторону «агентского» разработки программного обеспечения, где системы ИИ могут выполнять сложные многоэтапные задачи с минимальным наблюдением за человеком.

«Одна тенденция, которую мы начинаем видеть, заключается в том, что агент становится доминирующим режимом, как вы хотите взаимодействовать с LLM», — сказал он. Клиенты все чаще опираются на комплект разработки программного обеспечения Claude Code для создания пользовательских рабочих процессов, которые обрабатывают все, от истории разговоров до интеграции инструментов и настройки безопасности.

Аналитическая панель панели предоставляет организациям для измерения этого перехода. По мере того, как агенты ИИ становятся более способными к автономным задачам по разработке программного обеспечения, предприятиям лидерам потребуются всесторонние данные, чтобы понять, как эти системы влияют на их процессы разработки.

Запуск является частью более широкой тенденции AI Enterprise, где организации выходят за рамки пилотных проектов, требующих подробной аналитики и измерений ROI для их инвестиций в области искусственного интеллекта. По мере того, как инструменты кодирования искусственного интеллекта превращаются из экспериментальных функций до основной инфраструктуры развития, видимость их использования и эффективности становится все более важной для лидеров технологий.

Для отрасли, основанной на измерении всего, от времени безотказной работы до кода, возможность, наконец, измерить влияние ИИ на производительность разработчиков может оказаться столь же ценной, как и сами инструменты искусственного интеллекта.

Источник

Исследование Google показывает, что LLMS отказывается от правильных ответов под давлением, угрожая многообразным системам искусственного интеллекта

admin 16.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Новое исследование исследователей в Google Deepmind и Университетского колледжа Лондона показывает, как формируют, поддерживают, поддерживают и теряют уверенность в своих ответах. Результаты показывают поразительное сходство между когнитивными предубеждениями LLMS и людей, а также подчеркивают резкие различия.

Исследование показывает, что LLM могут быть чрезмерно уверенными в своих собственных ответах, но быстро теряют эту уверенность и меняют свое мнение, когда представляется контраргумент, даже если контраргумент неверен. Понимание нюансов такого поведения может иметь прямые последствия того, как вы создаете приложения LLM, особенно разговорные интерфейсы, которые охватывают несколько ходов.

Тестирование уверенности в LLMS

Критическим фактором в безопасном развертывании LLM является то, что их ответы сопровождаются надежным чувством доверия (вероятность того, что модель присваивает токен ответа). Хотя мы знаем, что LLM могут создать эти оценки доверия, степень, в которой они могут использовать их для руководства адаптивным поведением, плохо охарактеризована. Существуют также эмпирические доказательства того, что LLMS может быть чрезмерно уверенным в своем первоначальном ответе, но также быть очень чувствительными к критике и быстро становятся недостительными в том же выборе.

Чтобы исследовать это, исследователи разработали контролируемый эксперимент, чтобы проверить, как LLM обновляют свою уверенность, и решить, следует ли изменять свои ответы, когда они представляются внешними советами. В эксперименте «отвечающий LLM» был впервые задан вопрос бинарного выбора, такой как определение правильной широты для города из двух вариантов. После того, как он сделал свой первоначальный выбор, LLM получил советы из вымышленного «совета LLM». Этот совет поступил с явным рейтингом точности (например, «этот совет LLM точен 70%») и будет либо согласен, или оставаться нейтральным в отношении первоначального выбора ответа LLM. Наконец, отвечающего LLM попросили сделать свой окончательный выбор.

Пример испытания достоверности в LLMS (источник: arxiv) — Пример теста доверия в LLMS Источник: arxiv

Ключевой частью эксперимента было контроль, был ли собственный первоначальный ответ LLM для него во время второго, окончательного решения. В некоторых случаях это было показано, а в других это было скрыто. Эта уникальная настройка, невозможно воспроизвести с участниками -участниками, которые не могут просто забыть свой предыдущий выбор, позволила исследователям выделить, как память о прошлом влияет на текущую уверенность.

Базовое условие, где первоначальный ответ был скрыт, а совет был нейтральным, установил, насколько ответ LLM может измениться просто из -за случайной дисперсии в обработке модели. Анализ был сосредоточен на том, как доверие LLM в его первоначальном выборе изменилась между первым и вторым поворотом, давая четкую картину того, как первоначальное убеждение или предварительное, влияет на «изменение ума» в модели.

Чрезмерная уверенность и недостоверность

Исследователи сначала изучили, как видимость собственного ответа LLM повлияла на его тенденцию к изменению своего ответа. Они заметили, что когда модель может видеть свой первоначальный ответ, она показала сниженную тенденцию к переключению по сравнению с тем, когда ответ был скрыт. Этот вывод указывает на конкретный когнитивный уклон. Как отмечает в статье, «этот эффект-тенденция придерживаться своего первоначального выбора в большей степени, когда этот выбор был видим (в отличие от скрытого) во время созерцания окончательного выбора,-тесно связан с явлением, описанным при изучении принятия человеческих решений, выбором, способствующим поддержке выбора».

Исследование также подтвердило, что модели интегрируют внешние советы. Столкнувшись с противоположными советами, LLM показал повышенную тенденцию менять свое мнение и снижение тенденции, когда совет поддерживал. «Этот вывод демонстрирует, что отвечающий LLM соответствующим образом интегрирует направление советов, чтобы модулировать изменение уровня мышления», — пишут исследователи. Тем не менее, они также обнаружили, что модель чрезмерно чувствительна к противоположной информации и в результате выполняет слишком большую достоверную обновление.

Чувствительность LLM к разным параметрам в доверительном тестировании Источник: arxiv

Интересно, что это поведение противоречит предвзятости подтверждения, часто наблюдаемого у людей, где люди предпочитают информацию, которая подтверждает их существующие убеждения. Исследователи обнаружили, что LLMS «против избыточного веса, а не поддерживающих советов, как когда первоначальный ответ модели был видим и скрыт от модели». Одним из возможных объяснений является то, что методы обучения, такие как обучение подкреплению от обратной связи с человеком (RLHF), могут побудить модели быть чрезмерно вечными для пользовательского ввода, явления, известного как Sycophancy (которое остается проблемой для лабораторий искусственного интеллекта).

Последствия для корпоративных приложений

Это исследование подтверждает, что системы ИИ не являются чисто логическими агентами, которыми они часто воспринимаются. Они демонстрируют свой собственный набор предубеждений, некоторые напоминают человеческие когнитивные ошибки и другие уникальные для себя, что может сделать их поведение непредсказуемым в человеческих терминах. Для предпринимаемых приложений это означает, что в расширенном разговоре между человеком и агентом ИИ самая последняя информация может оказать непропорциональное влияние на рассуждения LLM (особенно если она противоречит первоначальному ответу модели), что может привести к тому, что он отбрасывает изначально правильный ответ.

К счастью, как также показывает исследование, мы можем манипулировать памятью LLM, чтобы смягчить эти нежелательные предубеждения способами, которые невозможны для людей. Разработчики, создающие многократные разговорные агенты, могут реализовать стратегии для управления контекстом ИИ. Например, длинный разговор может быть периодически суммирован, с ключевыми фактами и решениями, представленными нейтрально и лишены того, какой агент сделал этот выбор. Затем это резюме можно использовать для инициирования нового, сгущенного разговора, предоставляя модель чистым сланцем для разума и помогая избежать предубеждений, которые могут проникать во время расширенных диалогов.

По мере того, как LLM становятся более интегрированными в корпоративные рабочие процессы, понимание нюансов их процессов принятия решений больше не является обязательным. Следующие основополагающие исследования, подобные этому, позволяют разработчикам предвидеть и исправить эти неотъемлемые предубеждения, что приводит к приложениям, которые не просто более способны, но и более надежными и надежными.

Источник

Смущение предлагает бесплатные инструменты для искусственного интеллекта для студентов по всему миру в партнерстве с Sheerid

admin 15.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Обиточность, поисковая система с AI, которая конкурирует с Google и CHATGPT, сотрудничает с компанией по проверке личности Sheerid, чтобы предложить до двух лет бесплатного обслуживания премиум-класса более 264 миллионам студентов по всему миру, сообщили компании в понедельник.

Сделка решает ключевую проблему для компаний по искусственному искусству: предоставление образовательного доступа к дорогостоящим инструментам при предотвращении мошенничества с дисконтом. Смущение значительно делает ставку на рынок образования, поскольку конкуренция за пользователей усиливается по всей отрасли.

В соответствии с соглашением, проверенные студенты могут получить доступ к Perplexity Pro, обычно по цене 20 долларов в месяц, через платформу проверки Sheerid, которая подключается к более чем 200 000 авторитетных источников данных в 190 странах. Программа будет доступна для всех студентов университета и второкурсника во всем мире, где Sheerid обеспечивает проверку, что дает 264 миллионам студентов подходящим во всем мире. Предложение включает в себя такие функции, как цитируемые исследования, подробные отчеты и интерактивные приложения ИИ.

По словам компаний, партнерство приходит в рост усыновления искусственного интеллекта, причем 86% студентов США используют инструменты для ИИ для поддержки своих исследований. Тем не менее, быстрый рост вызвал обеспокоенность по поводу академической целостности и необходимости инструментов искусственного интеллекта, разработанных специально для использования в образовании.

Как продвинутая технология проверки останавливает сложное мошенничество со скидками студентов

Sheerid, компания из Портленда, основанная в 2011 году, создала свой бизнес, занимаясь решением постоянной проблемы для розничных продавцов и поставщиков услуг: проверка того, что потребители фактически принадлежат группам, имеющим право на специальные скидки, такие как студенты, военнослужащие или работники здравоохранения.

«Мы проверяем эти данные аудитории клиента, а затем обогащаем этот бренд CRM с этими разрешенными данными, чтобы они могли полностью привлечь свою самую верную аудиторию», — объяснила Ребекка Граймс, директор по доходам в Sheerid, в эксклюзивном интервью VentureBeat. «Наша платформа построена так, чтобы мы могли предоставить этот беспроблемный, надежный и быстрый опыт для их потребителей».

Процесс проверки начинается с основной информации, такой как имя, дата рождения и университет. Ширид немедленно проверяет это против авторитетных источников данных, которые, по словам Граймса, по словам компании построила отношения с более чем 14 -летним бизнесом. Если мгновенная проверка не удается, система перемещается на проверку документов с использованием как анализа, основанного на AI, так и ручной проверки.

«Если мы не сможем обработать это с помощью наших авторитетных источников данных, то существует постепенный шаг, когда вы добавляете загрузку документа», — сказал Граймс. «Как только это попадет в нашу систему, это еще один уровень дополнительного обзора, который автоматизируется в рамках нашего процесса обзора документов ИИ, а также, в некоторых случаях, в ручном обзоре DOC».

По словам Граймса, компания может завершить этот вторичный процесс проверки в среднем менее 3 минут.

Почему маркетинг на основе идентификации поставляет 337% ROI для крупных брендов

Партнерство отражает растущую изощренность мошенничества в программах скидок студентов. Джесси Дуайер, руководитель отдела связи в Nemplomaty, сказал, что акцент компании на точности делает ее особенно ценным для академических пользователей, которым нужна надежная информация.

«Для большинства производителей моделей искусственного интеллекта определенное количество галлюцинации — это особенность, и для недоумения это ошибка», — сказал Дуайер в эксклюзивном интервью VentureBeat. «Это то, что мы нашли академическим ценностями, студенты ценят это, специалисты по финансам очень ценят это».

В отличие от конкурентов, которые обучают модели ИИ на пользовательских данных, Дуайер сказал, что недоумение не использует информацию о клиентах для учебных целей. «Мы не тренируемся в ваших данных», — сказал он. «Модель на самом деле не обучена вашим данным».

Sheerid работает на модели программного обеспечения как услуги, заряжая доступ к платформе, объему обработки проверки и службы поддержки. Компания, в которой работает около 160 сотрудников с офисами в США и Европе, работает с крупными брендами, включая Amazon, Spotify и T-Mobile.

Согласно исследованию, проведенному Ширидом из Forrester Consulting, клиенты, использующие платформу для проверки компании, достигли 337% доходности инвестиций за счет увеличения выручки, предотвращения мошенничества и операционных сбережений.

Как недоумение стремится победить CHATGPT и Google в битве за студентов

Компании ИИ все чаще нацелены на рынок образования. Смущение отличается от более крупных конкурентов, таких как инструменты поиска Openai и Google, подчеркивая точность и атрибуцию источника.

«То, что мы делаем со сторонними моделями, так это то, что мы делаем две формы адаптации», — объяснил Дуайер. «Мы строим наши собственные модели, которые смотрят на запрос, который вы просите… мы переформулируем запросы. Поэтому вы задаете вопрос в одну сторону, в чем ИИ хорош, это то, что он может задать тот же вопрос тысячи разных способов». Дуайер отметил, что переформулировка запроса является лишь одним из примеров многих методов, используемых для постоянного тестирования и достижения более высокой точности.

Этот акцент на точности решает проблемы с преподавателями по поводу инструментов искусственного интеллекта, которые могут генерировать правдоподобную, но неверную информацию. Дуайер сказал, что подход «Снижения» соответствует академическим ценностям, связанным с построением знаний с помощью проверенных источников.

«Система рецензирования была разработана для создания чувства точности… чтобы будущие поколения могли опираться на эти установленные знания», — сказал он.

Реальная стоимость раздачи миллионов в бесплатных услугах искусственного интеллекта студентам

Программа доступа учащихся является крупным инвестицией для недоумения, хотя руководители компании отказались указать стоимость. Дуайер отметил, что в отличие от традиционного программного обеспечения, инструменты искусственного интеллекта имеют прямые вычислительные затраты для каждого запроса.

«Каждый запрос имеет прямые затраты с точки зрения вычисления», — сказал Дуайер. «Это то, о чем мы помним, и мы строим наши партнерские отношения».

Тем не менее, компания видит стратегическую ценность в построении отношений с академическими пользователями. В отличие от многих технологических компаний, которые монетизируются с помощью рекламы, Дуайер сказал, что реклама представляет «менее половины процента нашего дохода», а компания не продает пользовательские данные.

Партнерство обеспечивает Sheerid воздействие быстро растущего рынка ИИ. Граймс сравнил текущий момент с первыми днями потоковой передачи музыки, когда Ширид начал работать с Spotify и другими услугами.

«Я думаю, что мы увидим аналогичные глобальные программы в индустрии искусственного интеллекта, помимо того, что они просто понадобятся со студентами, нуждающимися в таких услугах, как Sheerid для поддержки их успеха», — сказала она.

Как данные студента остаются защищенными в эпоху проблем с конфиденциальностью ИИ

Обе компании подчеркнули свой подход к конфиденциальности данных, особенно важно, учитывая недавние опасения по поводу использования личной информации компаний. Sheerid работает как процессор данных, а не контроллер, что означает, что данные клиента принадлежат партнеру по бренду, а не Sheerid.

«Мы процессоры, поэтому мы не контроллер, поэтому мы просто обрабатываем эти данные от имени этого бренда», — объяснил Граймс. «Мы не контролируем право собственности на эти потребительские данные».

Система проверки рассматривает дополнительные сигналы помимо документов, чтобы предотвратить мошенничество, включая местоположение IP -адреса и близость к заявленным университетам. Эта «триангуляция всех этих процессов и данных» позволяет Шириду «уверенно подтвердить право или неприемлемость против предложения», — сказал Граймс.

Что это партнерство сигнализирует о будущем ИИ в образовании

Партнерство отражает более широкие тенденции как в отраслях ИИ, так и в отрасли проверки идентификации. В последние годы Sheerid быстро расширился, запустив новые продукты для проверки проверки в магазине и на основе доходов. Компания назначила бывшего генерального директора Ruby Стефани Коупленд Вебер в качестве генерального директора в июне 2024 года, когда основатель Джейк Уэтерли перешел на роль совета директоров.

Для недоумения, основанного в 2022 году, рынок образования представляет собой естественное соответствие для своих инструментов ИИ, ориентированных на исследования. Компания обрабатывает более 150 миллионов вопросов еженедельно по всему миру и позиционирует себя как «двигатель ответов», который предоставляет информацию о производстве, а не генерирует творческий контент.

Партнерство происходит на фоне более широкого изучения роли ИИ в образовании, когда учреждения сталкиваются с вопросами академической целостности и надлежащим использованием инструментов ИИ. Требуя проверку и акцентирования точности, обе компании стремятся решить эти проблемы при расширении доступа к возможностям ИИ.

«Мы бы поощряли преподавателей и университетов или исследователей любого рода, чтобы протянуть руку и попытаться смущения», — сказал Дуайер. «Мы одна из немногих ведущих технологических компаний, которые основали не только аспирант, что довольно распространено, мы основали тот, кто фактически закончил свою докторскую степень».

Источник

Остальные команды и техники Виндсурф, приобретенные по познаниям, создатели Девина: «Мы снова дружим с антропным»

admin 15.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Автономное стартап -познание кодирования ИИ подписало окончательное соглашение о приобретении Windsurf, Startup для разработчика искусственного интеллекта, наиболее известным благодаря своей агентной интегрированной среде разработки (IDE). Обе компании сделали объявление на своих учетных записях X в понедельник. Никакая сумма приобретения не была раскрыта публично, и не было конкретных условий сделки (оба являются частными стартапами).

Приобретение дает познание доступ к основному продукту Windsurf, бренду и оставшейся команде, но не его первоначальному генеральному директору или соучредителям, некоторые из которых присоединились к Google в отдельной сделке талантов и лицензирования в 2,4 миллиарда долларов, как впервые сообщила Verge на прошлой неделе.

В совместном видео, опубликованном в X, с участием генерального директора Cognition Скотт Ву и временного генерального директора Windsurf Джефф Ванг, лидеры заявили, что начнут с интеграции автономного инженера по ИИ познания в IDE Windsurf.

Это комбинированное предложение направлено на то, чтобы позволить разработчикам планировать задачи, делегировать генерацию кода для агентов искусственного интеллекта и просмотреть запросы на привлечение — все в одном интерфейсе.

«Это идеально подходит», — сказал Ван, который ранее был главой бизнеса Виндсурфа. «Работа с лучшей инженерной командой в пространстве станет невероятной разблокировкой для нашего продукта и нашей команды по выходу на рынок».

В сообщении в блоге компании под названием «Следующая глава» Ван непосредственно признал внутренние потрясения: «На прошлой неделе мы потеряли наших основателей и нашу исследовательскую группу».

Он высоко оценил оставшегося персонала за их профессионализм во время перехода и подчеркнул, что, несмотря на нарушение, «так много из того, что делает нас великими, не повреждено».

По словам Ванга, Windsurf продолжает удвоить доход от предприятия за четверть в четверг и поддерживает сотни тысяч ежедневных активных пользователей.

Познание подчеркнуло, что сделка включает в себя полное финансовое участие для работников Виндсурф, в том числе отмены скалы и ускоренное передачу.

Ван также заявил в видео объявлении: «И, конечно, мы снова с Антропейкой», — явная ссылка на предварительное выпадение Виндсурф с отдельной компанией поставщика моделей искусственного интеллекта, которая привела к тому, что модели Антропического Клода были извлечены из списка вариантов, на которые разработчики могут рассчитывать на власть своих кодирующих агентов и процессов Windsurf AI.

Но новая глава следует хаотичному и фрагментированным несколько месяцев, отмеченных прерванными переговорами по приобретению, утерянным модельным доступом и основными отъездами для исполнительных директоров.

Фрагментированный выход: познание получает продукт и пользователей, Google получает основателей

11 июля Google подтвердил, что нанял Варуна Мохана, соучредителя и генерального директора Виндсурфа, вместе с другими старшими членами команды R & D.

CNBC сообщил, что Google выплачивает 2,4 миллиарда долларов в виде компенсации и лицензионных сборов в рамках сделки, которая включает неэксклюзивную лицензию на выбор технологии Виндсурф.

Сделка делает нет Включите любые инвестиции в акционерный капитал в Windsurf, а также полное приобретение компании.

«Мы рады приветствовать некоторых лучших талантов кодирования ИИ от команды Windsurf в Google DeepMind», — сказал представитель Google CNBC.

Между тем Windsurf сохраняет возможность лицензировать свои технологии и будет продолжать работать независимо под руководством Ван.

Разделенная структура отражает фрагментированное разрешение на то, что ранее сообщалось как полномасштабное приобретение OpenAI.

Блумберг Еще в мае сообщил, что OpenAI вступил в переговоры по эксклюзивности, чтобы купить Windsurf за 3 миллиарда долларов. Тем не менее, эти переговоры развалились, и позже Openai сообщил CNBC, что период эксклюзивности истек.

В то время как компания никогда не подтверждала приобретение Openai, Fallout были видны — каналы коммуникаций Windsurf замолчали, его продукт испытал нестабильность и многочисленные партнеры, по сообщениям, отступили.

Друзья с антропным снова

Среди самых разрушительных ударов произошел антропный, который в начале июня отменил доступ Виндсурфа к своему модельным модельным семейству Claude 3.

В заявлении, опубликованном в своем блоге, Windsurf подтвердил, что Anpropic отрезал почти всю личную способность API, чтобы Claude 3.5 Sonnet, Claude 3.7 Sonnet и связанные с ними модели с уведомлением менее недели.

В ответ Windsurf должен был перенаправить трафик через сторонних поставщиков выводов и ограничить доступ для бесплатных пользователей. Компания также запустила рекламные цены для Gemini Pro в качестве временного замены.

Антрический соучредитель Джаред Каплан объяснил решение TechCrunch Sessions: AI 2025Сказав, что компания не может оправдать поставку своего крупнейшего конкурента OpenAI, с доступом к своим моделям через средний уровень.

«Для нас было бы странно продать Клода в Openai», — сказал он, сославшись на конкурентоспособную напряженность, так и ограниченную вычислительную мощность Anpropic. Каплан добавил, что антроп предпочитает сосредоточиться на «долгосрочных партнерских отношениях», подобных тому, которое он поддерживает с курсором.

Windsurf, в своем заявлении, выразил разочарование и подчеркнул, что его платформа — это больше, чем просто доступ к модели. «Магия Виндсурфа никогда не ограничивалась моделью», — написала компания, выделяя функции UX, интеграции предприятия и агентские рабочие процессы.

Новое видение продукта для комбинированного Виндсерфа/Познания/Девина

Соглашение Cognition теперь привносит давно необходимую ясность в эксплуатационном направлении Виндсурфа. В видео, объявляющем о сделке, познание Ву описывает, как будут интегрироваться две платформы: «Представьте себе, что задачи планирования в Виндсурф, запустив команду Девинс и просмотрели PRS без комфорта вашей IDE».

Девин, который может автономно выполнять программные задачи, такие как исправление ошибок и развертывание приложений, теперь будет встроен непосредственно в IDE Windsurf.

Компании говорят, что эта настройка даст разработчикам возможность разгружать повторяющиеся работы на несколько агентов параллельно, при этом сохраняет контроль над ключевыми архитектурными решениями.

Познание рассматривает это как следующий шаг в строительстве совместных систем человека-агентов и говорит, что IDE Windsurf предоставляет недостающий уровень интерфейса, чтобы сделать агентские рабочие процессы практичными в масштабе. Обе компании выразили уверенность в том, что пользователи получат выгоду от более плавного, тесно интегрированного опыта разработки.

Пост в блоге Windsurf также расширился на планы уровня продукта, подтверждая, что существующие функции Windsurf, такие как TAB и CASCADE, используемые для ручного кодирования высокого рычага, останутся в IDE.

Разработчики смогут назначить работу «команде Девинов», все еще прыгая, чтобы завершить или редактировать сами сложные части. «Он плавно сшивается вместе в одной и той же среде», — написал Ван.

Консолидация среди конкуренции

Объединенная организация познания-в-вульдора теперь конкурирует напрямую с Github Copilot, Recepit, Cursor и другими игроками IDE-IDE. Платформа Gemini от Google и код Microsoft Visual Studio с «режимом агента» также быстро расширяются в это пространство.

Девин попал в заголовки газет в начале этого года из-за своей способности автономно решать проблемы GitHub и выполнять комплексные задачи кодирования. Объединение этой возможности с настраиваемой средой Windsurf, включая такие функции, как предварительные просмотра, обзоры и корпоративные рабочие процессы, может создать продукт с меньшим количеством бункеров и большей автоматизации, чем конкуренты.

Тем не менее, продолжающаяся талантская война означает, что конкурентное преимущество недолговечено. Способность Google нанимать команду-основателя Windsurf, в том числе Мохан и соучредитель Дугласа Чена, сигнализирует, что даже частичные выходы теперь поставляются с ценниками многомиллиардов. Meta, Amazon и Microsoft сделали аналогичные шаги, поглощая ключевые фигуры из стартапов, таких как AI Scale, Adept и Inflection.

Несмотря на то, что лидерство встряхнула, Windsurf продолжает операции под руководством Ван.

«Большая часть команды мирового класса Windsurf будет продолжать создавать продукт Windsurf с целью максимизации его влияния на предприятие»,-сказал он в своем заявлении.

Ван также подчеркнул, что команда выбрала познание по сравнению с другими жизнеспособными вариантами, ссылаясь не только на техническое выравнивание, но и восхищение: «Они были единственной командой, которой мы боялись».

Он отметил, что выручка Cognition растет даже быстрее, чем Windsurf, и что его финансирование на 300 миллионов долларов и оценка в 4 миллиарда долларов отражает сильные финансовые основания.

Ожидается, что компания будет сосредоточена на готовности к предприятию, возможностям агента IDE и гибридным/федеративным развертываниям — основным функциям, которые помогли ему выделиться в многолюдном поле.

Для разработчиков путь вперед теперь включает в себя как преемственность, так и изменения: продукт, который остается в живых в рамках познания, команда -основателя, которая сейчас в DeepMind и ландшафт, быстро консолидируя вокруг модели доступа и инженерного таланта.

Источник

Обзор сервисов

Claude Connectors

admin 15.07.2025

admin

Anthropic представил Connectors Directory — централизованный каталог для подключения Claude к популярным сервисам. Теперь вместо ручной настройки интеграций достаточно одного клика, чтобы нейросеть получила доступ к Notion, Figma, Stripe и другим инструментам. Это превращает Claude в универсальный командный центр для работы.

Claude Connectors — Новый раздел Connectors Directory в интерфейсе Claude

Содержание

Ключевые возможности
Топ-5 интеграций
Как подключить?
Пример работы
Тарифные ограничения
Безопасность
Важные предупреждения
Перспективы

Ключевые возможности

50+ готовых интеграций: От Figma до Stripe
Подключение за 20 секунд: Без API-ключей и вебхуков
Локальные расширения: Доступ к файловой системе даже на бесплатном тарифе
Кастомные коннекторы: Для корпоративных решений

Топ-5 интеграций

Сервис	Что умеет Claude
Notion	Синхронизировать базы данных, генерировать отчеты
Figma	Анализировать дизайн-макеты, предлагать правки
Linear	Создавать задачи, отслеживать баги
Stripe	Формировать платежи, анализировать транзакции
Zapier	Строить автоматизации между 5000+ сервисов

Как подключить?

Откройте каталог интеграций
Выберите инструмент (Canva, Notion и др.)
Нажмите “Connect” → Авторизуйтесь в сервисе
В чате включите инструмент через “Search and tools”

Пример работы

После подключения Linear:

Пользователь: "Создай задачу для дизайнера: переделать кнопку входа"
Claude: ✓ Задача создана в Linear [LND-781]

Тарифные ограничения

Функция	Бесплатный	Pro/Max	Enterprise
Локальные расширения	✓	✓	✓
Облачные интеграции	✗	✓	✓
Кастомные коннекторы	✗	✗	✓

Безопасность

Проверенные инструменты: Все коннекторы верифицированы Anthropic
Контроль разрешений: Вы выбираете уровень доступа
Песочница: Действия выполняются в изолированной среде
Мониторинг: Журнал всех операций в настройках

Важные предупреждения

При подключении:

Claude получает доступ к вашим данным в сервисе
Может совершать действия от вашего имени
Отключайте неиспользуемые интеграции

Перспективы

По данным Anthropic, в разработке:

Интеграция с Google Workspace и Microsoft 365
Поддержка криптокошельков (MetaMask, Phantom)
Биометрическая аутентификация для конфиденциальных операций

Совет: Начните с безопасных инструментов вроде Notion — их легко отключить при необходимости.

P.S. Это шаг к миру, где ИИ становится операционной системой для работы. Как заметил один из разработчиков: “Скоро мы будем объяснять новым сотрудникам, что раньше люди сами заходили в 10 разных сервисов”.

Источник

Четвертая волна ИИ здесь — готовы ли предприятия к тому, что дальше?

admin 15.07.2025

admin

Вчерашняя новая технология теперь необходима для успеха в бизнесе — и следующая волна наступает быстро. Чтобы поддерживать конкурентное преимущество в течение следующих пяти лет, какие инновации должны сейчас расставлять приоритеты в дальновидных компаниях?

В Transforce 2025 году в Venturebeat, Yaad Oren, глобальном руководителе SAP Research & Innovation, и Эмма Брунскилл, доцент кафедры компьютерных наук в Стэнфорде, рассказала с модератором Сьюзен Этлингер, старший директор, стратегию и лидерство за мысли, Azure AI Microsoft, о стратегиях, необходимых сегодня, для преобразующих технологий завтра.

https://www.youtube.com/watch?v=kowaqaxb-ws

Как текущий ландшафт будет формировать будущее

По словам Орен, четвертое поколение ИИ — Генеративное ИИ — знаменует собой сдвиг парадигмы в том, что ИИ приносит на стол, излагая три основных местах, которые он приносит значительную ценность и нарушения для предприятия. Первый — это пользовательский опыт и то, как люди взаимодействуют с программным обеспечением. Второе — автоматизация на уровне приложений — SAP внедрила приблизительно 230 возможностей ИИ и агентов AI в его приложениях, и к концу 2025 года планируется увеличить это число до 400, чтобы повысить производительность и снизить затраты. Третья область — это платформа — основной двигатель, который поддерживает каждое предприятие, которое поднимает новые вопросы об опыте разработчика, а также о конфиденциальности и доверии.

«Мы видим много нарушений вокруг UX, приложения и самой платформы, которая предоставляет все инструменты для борьбы с этим новым сокровищницей Options, AI предоставляет предприятиям», — подытожил Орен.

Для Brunskill большой вопрос заключается в том, как ИИ может интегрироваться с людьми, чтобы повысить социальную ценность, а не действовать как вор человеческого творчества и изобретательности. Недавнее исследование показало, что если предприятие создает инструменты ИИ в качестве повышения производительности, люди будут использовать их гораздо реже, чем если бы они создали как улучшение задач.

«Это довольно большой доход, так как мы думаем о том, как перевести некоторые необычайные возможности этих систем в системы, которые приводят к ценности для клиентов, для организаций и других»,-сказал Брунскилл. «Нам нужно подумать о том, как они обрамлены».

Орен добавил, что ценность бизнеса на уровне предприятия должна быть главным, и это означает, что даже по мере развития технологий ИИ на предприятии должен выйти за рамки технологий ради технологий. Самая сексуальная новая технология часто обеспечивает наименьшую ценность.

«То, что вы видите сегодня, является распространением многих решений, которые создают отличные аватары прыжков в фильмах, которые выглядят потрясающе, но ценность: как вы помогаете предприятию снизить затраты? Как вы помогаете предприятию повысить производительность или доход? Как вы можете снизить риск?» он сказал. «Это мышление не совсем там с ИИ. Вам всегда нужно начать с бизнес -проблемы. Количественная оценка ценности, которой вы хотели бы достичь».

Прогнозы на будущее ИИ

Искусственный общий интеллект (AGI)-это теоретический прорыв, в котором ИИ будет соответствовать или превзойти универсальность на уровне человека и решения проблем по большинству когнитивных задач. Будущее ИИ и определение того, что такое AGI, станет большой темой для обсуждения в ближайшие несколько лет.

Брунскилл определяет это то, что ИИ может выполнять любую когнитивную задачу, по крайней мере, а также средний человек в профессии.

«С точки зрения многих рабочих мест белых воротничков, которые просто требуют когнитивной обработки, я думаю, что мы собираемся добиться огромных успехов в ближайшие пять лет»,-сказал Брунскилл. «Я не думаю, что мы еще готовы. Я думаю, что нам нужно много творческого размышлений о том, что это будет значить для отраслей. Что это будет делать с вашей рабочей силой? Меня очень интересует, как мы думаем о переподготовке рабочей силы и как мы собираемся обеспечить значимую работу многим людям, идущим вперед. Какие новые возможности у нас будут?»

Будущее ИИ, определение AGI, является большим, и мы не так близко, как предпочли бы многие люди, сказал Орен, но на этом пути мы увидим новую захватывающую технологию и шесть основных столбов с нарушениями: следующее поколение AI за пределами его текущих возможностей, будущее платформы данных, роботовидные данные, квантовые вычислительные вычисления, Enterpress Enterprese Enterpreseration и будущая архитектура данных.

«Архитектура трансформатора в этом поколении — ничто по сравнению с тем, что будет», — сказал он. «Новый тип мета-обучения. ИИ учится развивать и создавать агентов само по себе. Эмоциональный ИИ. Будущее ИИ, определение AGI, является большим».

Будущее самого данных также имеет решающее значение. Мы приближаемся к границам реальных данных-даже источники, такие как Википедия, уже полностью поглощены моделями ИИ. Чтобы стимулировать следующий скачок в прогрессе искусственного интеллекта, создание синтетических данных и улучшение качества данных будут важны.

Тогда есть робототехника, которая быстро развивается — мы узнали из недавних инноваций, таких как DeepSeek, что вы можете сделать «больше с меньшим количеством» и установить очень мощный ИИ на краю. Quantum поможет создать сдвиг парадигмы в том, как мы запускаем оптимизацию и моделирование процессов. И будущее Enterprise UX станет еще одним нарушением, которое предоставит пользователям новый тип персонализации, адаптация экранов к конкретному контексту и захватывающий опыт.

«Поколение моих детей выйдет на работу после 2030 года. Что будет их парадигмой UX?» Орен сказал. «Им нужна эмоциональная связь для экранов. Им нужны адаптивные экраны. Это совершенно отличается от того, что мы делаем сегодня».

Источник

Перестаньте проверять инженеры, такие как 2021 год-пришла рабочая сила AI-местной

admin 14.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Вы уже позади, если вы все еще проверяете инженеры, как 2021 год. Мы переживаем то, что, по моему мнению, будет самым преобразующим технологическим сдвигом нашей жизни, даже больше, чем Интернет.

Революция ИИ ускоряется в темпе, который большинство из нас даже не может понять. Это не шумиха. Это перекалибровка того, что значит строить, создавать и работать. Основатели, которые готовится сейчас, приведут к тому, что будет дальше. Те, кто не окажутся опережающими от пяти человек, а также родственных стартапов, которые работают с 10-кратной скоростью и точностью.

Итак, как вы нанимаете разработчиков в эту эпоху ускорения?

Вы не проверяете их для того, как хорошо они пишут код. Вы показываете их, чтобы увидеть, насколько хорошо они организуют это. Позвольте мне объяснить.

Свободно беглости ИИ на самом деле новая грамотность

Каждый основатель хочет «разработчика ИИ». Но этот термин может означать много вещей. Вы ищете кого -то для создания больших языковых моделей (LLMS) в Python? Или кто -то обладает опытом использования инструментов ИИ для повышения скорости и уменьшения ошибок?

Большинству компаний нужен второй. Но они не всегда знают, как просить об этом. Вот почему беглость ИИ или то, насколько хорошо разработчик может ориентироваться и использовать широкий спектр инструментов ИИ, становится таким же важным, как знание конкретного языка или структуры.

Инструмент будет продолжать меняться. Но мета-навык обучения, как использовать новых помощников по искусственному интеллекту, оценить их результаты и включить это в свой рабочий процесс? Это долговечное преимущество.

Что такое Ai-Orchestrator, и зачем он вам нужен?

Оркестратор ИИ является сегодняшним важным архетипом разработчика. Они не пишут каждую строку кода-они приглашают, критикуют, отлаживают и рефактор, сгенерированный AI. Они понимают, когда делегировать на машины и когда применять свое суждение. И они знают, как общаться с агентами искусственного интеллекта, такими как коллеги.

В то же время, в то время как ИИ быстрый, это не всегда правильно. И это, конечно, не знает конкретных потребностей вашей компании. Таким образом, черты, которые вы захотите расставить приоритеты при найме:

Архитектура — Способность масштабировать и проектировать системы на высоком уровне.
Критическое мышление -Оценка компромиссов, принятие хороших решений и выбор правильных инструментов для работы.
Коммуникация — Это большой. Насколько хорошо вы можете объяснить свое мышление роботу? ИИ не делает эвристику. Вы не получите то, что вам нужно, если не можете сформулировать то, что вы хотите.

Точно так же, как мы не перестали преподавать математику, потому что существуют калькуляторы, мы не можем отказаться от навыков основополагающих программирования только потому, что ИИ пишет код. Нам нужны разработчики, которые понимают архитектуру, знают, когда доверять ИИ, и знать, когда вмешаться и исправить то, что сломано.

4 способа оценки компетенции ИИ инженера

В ответ на распространение инструментов ИИ моя компания пересмотрела то, как мы проверяем технические таланты. Традиционный процесс технических интервью, проблем с алгоритмом и тестов кодирования, специфичных для языка, больше не сокращают его.

Вот что делать вместо этого:

Симулировать реальное решение проблем. Попросите кандидатов создать функцию или отлаживать проблему, но не позволяйте им сами написать какой -либо код. Вместо этого требуйте, чтобы они использовали такие инструменты, как CHATGPT или Claude, все время делясь своим экраном, чтобы вы могли наблюдать, как они взаимодействуют с ИИ.
Оценить подсказка. Вы не просто ищете правильный ответ. Вы хотите увидеть, как кандидаты создают проблему, предпринимают ИИ и уточнить и итерацию на его результатах. Это упражнение — больше о определении ясности мысли и общения кандидата по поводу мастерства синтаксиса.
Проверьте подлинность. Да, люди будут пытаться обмануть, поделившись экранами с кем -то другим, заставляя кого -то выдавать себя за них или прибегать к Deepfakes. Вот почему вы захотите настаивать на полноэкранном обмене и включении их камеры. Пусть разработчики знают, что вы не пытаетесь натянуть на них «Gotcha»; Вы хотите понять, как они работают с ИИ ежедневно.
Испытательное решение. Легко получить рабочий код от ИИ. Более сложный навык — это знание того, является ли это хорошим кодом, соответствует архитектуре системы и является правильным решением для этой проблемы. На всех этих шагах вы захотите посмотреть, смогут ли они очистить планку критического мышления из-за простой копии.

Что помнить об усыновлении ИИ

Моя команда предполагала, что старшие разработчики получат больше от ИИ. Но то, что мы нашли, удивило нас. В серии опросов младшие разработчики сообщили о высоких ростах производительности от ИИ, но часто не хватало суждения, чтобы уловить ошибочную производительность. Старшие разработчики, напротив, были скептическими или осторожными, что привело к более низкой краткосрочной прибыли.

Итак, мы построили обучение для каждого уровня опыта. Для юниоров речь идет о том, чтобы замедлить их, помогая им понять, где ИИ управляет им неправильно. Для пожилых людей речь идет о том, чтобы обучить их интеграции ИИ без потери контроля. В обоих случаях цель состоит в том, чтобы разблокировать реальную производительность без ущерба для качества.

Принять это изменение создает возможность

Да, этот переход к ИИ страшно. И да, будет турбулентность. Будут рабочие места, которые исчезают, и новые, которые поднимаются. Но те, кто учатся экранировать, тренировать и создавать команды вокруг таланта с поддержкой AI, напишут будущее.

Если вы все еще нанимаете инженеров для того, что они могут сделать в одиночку, вы упускаете суть. Начните нанимать их в зависимости от того, насколько хорошо они работают с машинамиПолем

Будущее не AI против людей. Это ИИ с Люди, и те, кто адаптируется самые быстрые, выиграют.

Жаклин Самира — основатель и генеральный директор Howdy.comкоторый создает и управляет элитными командами разработчиков программного обеспечения по всей Латинской Америке.

Источник

Создание AI Voice AI, который слушает всех: передача обучения и синтетическую речь в действии

admin 13.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Вы когда -нибудь думали о том, что значит использовать голосового помощника, когда ваш собственный голос не соответствует тому, что ожидает система? ИИ не просто изменяет, как мы слышим мир; Это трансформирует, кто будет услышан. В эпоху разговорного ИИ доступность стала важным эталоном для инноваций. Голосовые помощники, инструменты для транскрипции и аудио-интерфейсы находятся везде. Одним из недостатков является то, что для миллионов людей с нарушениями речи эти системы часто могут терпеть неудачу.

Как человек, который много работал над речевыми и голосовыми интерфейсами на автомобильных, потребительских и мобильных платформах, я видел обещание ИИ в улучшении того, как мы общаемся. По моему опыту, ведущая разработка звонков без громкой связи, массивов для формирования луча и систем бодрствования, я часто спрашивал: что происходит, когда голос пользователя выходит за пределы зоны комфорта модели? Этот вопрос заставил меня думать о включении не только как функции, но и ответственности.

В этой статье мы рассмотрим новую границу: ИИ, который может не только повысить ясность и производительность голоса, но и в корне обеспечить разговор для тех, кто оставил позади традиционные голосовые технологии.

Переосмысление разговорного ИИ для доступности

Чтобы лучше понять, как работают инклюзивные речевые системы искусственного интеллекта, давайте рассмотрим архитектуру высокого уровня, которая начинается с нестандартных речевых данных и использует обучение передачи на модели с тонкой настройкой. Эти модели разработаны специально для нетипичных речевых шаблонов, создавая как распознаваемый текст, так и даже синтетические голосовые выходы, адаптированные для пользователя.

Стандартные системы распознавания речи борются, когда сталкиваются с нетипичными речевыми моделями. Будь то из -за церебрального паралича, БАС, заикания или вокальной травмы, люди с нарушениями речи часто не вызывают или игнорируются текущими системами. Но глубокое обучение помогает изменить это. Обучив модели на нестандартных речевых данных и применяя методы обучения переноса, разговорные системы ИИ могут начать понимать более широкий спектр голосов.

Помимо признания, генеративный ИИ в настоящее время используется для создания синтетических голосов на основе небольших образцов от пользователей с нарушениями речи. Это позволяет пользователям обучать свой собственный голосовой аватар, обеспечивая более естественное общение в цифровых пространствах и сохраняя личную вокальную идентичность.

Существуют даже платформы, где люди могут вносить свои речевые модели, помогая расширить публичные наборы данных и улучшить будущую инклюзивность. Эти краудсорсингированные наборы данных могут стать критическими активами для создания систем искусственного интеллекта по -настоящему универсальными.

Вспомогательные функции в действии

Системы вспомогательного увеличения голоса в реальном времени следуют сложному потоку. Начиная с речевого ввода, который может быть дисфлуентом или отсроченным, модули ИИ применяют методы улучшения, эмоциональный вывод и контекстуальную модуляцию, прежде чем производить четкую, выразительную синтетическую речь. Эти системы помогают пользователям говорить не только разумно, но и осмысленно.

Вы когда -нибудь предполагали, каково это, чтобы говорить плавно говорить с помощью ИИ, даже если ваша речь нарушена? Увеличение голоса в режиме реального времени-одна из таких функций, которые делают шаги. Увеличивая артикуляцию, заполняя паузы или сглаживая дисфузости, ИИ действует как совместный пилот в разговоре, помогая пользователям сохранять контроль при улучшении разборчивости. Для людей, использующих интерфейсы текста в речь, разговорной ИИ теперь может предлагать динамические ответы, фразы на основе настроений и просодию, которая соответствует намерению пользователя, возвращая личность обратно компьютерному общению.

Другая многообещающая область — прогнозное языковое моделирование. Системы могут изучить уникальные фразы или словаря пользователя, улучшать прогнозирующий текст и ускорить взаимодействие. В сочетании с доступными интерфейсами, такими как клавиатуры для отслеживания глаз или элементы управления SIP-and Puff, эти модели создают отзывчивый и беглый поток разговоров.

Некоторые разработчики даже интегрируют анализ выражения лица, чтобы добавить больше контекстного понимания, когда речь затруднена. Комбинируя мультимодальные входные потоки, системы ИИ могут создавать более нюансированный и эффективный шаблон отклика, адаптированный к режиме связи каждого человека.

Личное представление: голос за пределами акустики

Однажды я помог оценить прототип, который синтезировал речь из остаточных вокализаций пользователя с ALS на поздних стадиях. Несмотря на ограниченную физическую способность, система адаптировалась к ее хриплому фонациям и реконструированной речи с тоном и эмоциями. Видеть ее свет, когда она услышала, как ее «голос» снова говорит, было унизительным напоминанием: ИИ — это не только показатели производительности. Речь идет о человеческом достоинстве.

Я работал над системами, где эмоциональный нюанс был последней проблемой, чтобы преодолеть. Для людей, которые полагаются на вспомогательные технологии, важно понимать, но чувство понимания является трансформационным. Разговорной ИИ, который адаптируется к эмоциям, может помочь сделать этот прыжок.

Последствия для строителей разговорного ИИ

Для тех, кто проектирует следующее поколение виртуальных помощников и голосовых платформ, должна быть встроена доступность, а не прикреплена. Это означает сбор различных данных обучения, поддержку невербальных входов и использование федеративного обучения для сохранения конфиденциальности при постоянном улучшении моделей. Это также означает инвестиции в обработку краев с низкой задержкой, поэтому пользователи не сталкиваются с задержками, которые нарушают естественный ритм диалога.

Предприятия, принимающие интерфейсы с AI, должны учитывать не только удобство использования, но и включение. Поддержка пользователей с ограниченными возможностями не просто этичная, это рыночная возможность. По данным Всемирной организации здравоохранения, более 1 миллиарда человек живут с какой -либо формой инвалидности. Доступный ИИ пользуется всеми, от стареющего населения до многоязычных пользователей до тех, кто временно нарушает.

Кроме того, существует растущий интерес к объяснимым инструментам ИИ, которые помогают пользователям понять, как обрабатывается их ввод. Прозрачность может укрепить доверие, особенно среди пользователей с ограниченными возможностями, которые полагаются на ИИ как коммуникационный мост.

С нетерпением жду

Обещание разговорного ИИ — это не только понимание речи, но и понимать людей. Слишком долго голосовая технология лучше всего работала для тех, кто говорит ясно, быстро и в узком акустическом диапазоне. С помощью ИИ у нас есть инструменты для создания систем, которые более широко слушают и реагируют более сострадательно.

Если мы хотим, чтобы будущее разговора было по -настоящему умным, оно также должно быть инклюзивным. И это начинается с каждого голоса.

Harshal Shah — это специалист по голосовой технологии, увлеченный тем, чтобы соединить человеческое выражение и понимание машины с помощью инклюзивных голосовых решений.

Источник

Новая парадигма для ИИ: как «мышление как оптимизация» приводит к лучшим моделям общего назначения

admin 12.07.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Исследователи из Университета Иллинойса Урбана-Шампейн и Университета Вирджинии разработали новую модельную архитектуру, которая может привести к более надежным системам ИИ с более мощными способностями рассуждений.

Архитектура, называемая энергетическим трансформатором (EBT), демонстрирует естественную способность использовать масштабирование времени вывода для решения сложных задач. Для предприятия это может привести к экономически эффективным приложениям для искусственного интеллекта, которые могут обобщить в новые ситуации без необходимости специализированных тонких моделей.

Задача мышления системы 2

В психологии человеческая мысль часто делится на два режима: система 1, которая является быстрой и интуитивно понятной, и система 2, которая является медленной, преднамеренной и аналитической. Современные модели крупных языков (LLMS) преуспевают в задачах в стиле системы, но индустрия ИИ все чаще сосредоточена на том, чтобы позволить мышлению System 2 решать более сложные проблемы рассуждений.

Модели рассуждений используют различные методы масштабирования времени вывода, чтобы улучшить их производительность по сложным проблемам. Одним из популярных методов является подкрепление обучения (RL), используемое в таких моделях, как DeepSeek-R1 и модели Openai «O-Series», где ИИ вознагражден за создание токенов рассуждений, пока не достигнет правильного ответа. Другой подход, часто называемый Best of-N, включает в себя создание нескольких потенциальных ответов и использование механизма проверки для выбора лучшего.

Однако эти методы имеют значительные недостатки. Они часто ограничиваются узким диапазоном легко проверяемых проблем, таких как математика и кодирование, и могут ухудшить производительность в других задачах, таких как творческое письмо. Кроме того, недавние данные свидетельствуют о том, что подходы, основанные на RL, могут не обучать моделям новых навыков рассуждения, вместо этого просто позволяя им с большей вероятностью использовать успешные модели рассуждений, которые они уже знают. Это ограничивает их способность решать проблемы, которые требуют истинного исследования и находятся за пределами их режима обучения.

Энергетические модели (EBM)

Архитектура предлагает другой подход, основанный на классе моделей, известных как энергетические модели (EBMS). Основная идея проста: вместо непосредственного генерирования ответа модель изучает «энергетическую функцию», которая действует как проверка. Эта функция берет на себя вход (как подсказка) и прогноз кандидата и присваивает ему значение или «энергию». Низкая оценка энергии указывает на высокую совместимость, что означает, что прогноз хорош для ввода, в то время как высокая оценка энергии означает плохой матч.

Применяя это к рассуждениям искусственного интеллекта, исследователи предлагают в статье, в которой разработчики должны рассматривать «мышление как процедуру оптимизации по отношению к изученному проверке, который оценивает совместимость (ненормализованную вероятность) между входным и прогнозом кандидатов». Процесс начинается со случайного прогноза, который затем постепенно уточняется путем минимизации его оценки энергии и изучения пространства возможных решений до тех пор, пока он не сходится с очень совместимым ответом. Этот подход основан на принципе, что проверка решения часто намного проще, чем генерировать его с нуля.

Этот дизайн «ориентированного на проверку» решает три ключевые проблемы в рассуждениях искусственного интеллекта. Во -первых, это позволяет динамическому распределению вычисления, что означает, что модели могут «думать» дольше по более сложным проблемам и короче простых проблем. Во-вторых, EBMS может, естественно, справиться с неопределенностью реальных проблем, где нет одного четкого ответа. В -третьих, они действуют как их собственные проверки, устраняя необходимость в внешних моделях.

В отличие от других систем, которые используют отдельные генераторы и проверки, EBMs объединяются в единую единую модель. Ключевым преимуществом этого расположения является лучшее обобщение. Поскольку проверка решения по новым данным, выходящим на распределение (OOD), часто проще, чем генерировать правильный ответ, EBM могут лучше обрабатывать незнакомые сценарии.

Несмотря на их обещание, EBM исторически боролись с масштабируемостью. Чтобы решить это, исследователи вводят EBT, которые являются специализированными трансформаторными моделями, предназначенными для этой парадигмы. EBT обучаются сначала проверять совместимость между контекстом и прогнозом, а затем совершенствуют прогнозы, пока они не найдут выходной сигнал с самой низкой энергией (наиболее совместимым). Этот процесс эффективно имитирует процесс мышления для каждого прогноза. Исследователи разработали два варианта EBT: модель только для декодера, вдохновленная архитектурой GPT, и двунаправленная модель, похожая на BERT.

Трансформатор на основе энергии (источник: GitHub)

Архитектура EBT делает их гибкими и совместимыми с различными методами масштабирования времени вывода. «EBT могут генерировать более длинные кроватки, самооценки, делать лучшие из N (или), которые вы можете попробовать из многих EBT»,-сказал VentureBeat, доктор философии, аспирант в области компьютерных наук в Университете Урбана-Шампейн и ведущий автор статьи. «Самое приятное, что все эти возможности изучаются во время предварительной подготовки».

EBT в действии

Исследователи сравнили EBT с установленными архитектурами: популярный рецепт Transformer ++ для генерации текста (дискретные методы) и диффузионный трансформатор (DIT) для таких задач, как предсказание видео и дженонирование изображений (непрерывные методы). Они оценили модели по двум основным критериям: «Масштабируемость обучения», или насколько эффективно они тренируют, и «масштабируемость мышления», которая измеряет, как производительность улучшается с большими вычислениями во время вывода.

Во время предварительной подготовки EBT продемонстрировали превосходную эффективность, достигнув до 35% более высокой скорости масштабирования, чем трансформатор ++ по данным, размеру партии, параметры и вычисления. Это означает, что EBT могут быть обучены быстрее и дешевле.

При выводе EBT также превзошел существующие модели по рассуждениям. «Мышление дольше» (используя больше шагов оптимизации) и выполняя «самоуверенность» (генерируя несколько кандидатов и выбрав один с самой низкой энергией), EBT улучшили производительность языкового моделирования на 29% больше, чем трансформатор ++. «Это согласуется с нашими утверждениями о том, что, поскольку традиционные трансформаторы для подачи не могут динамически распределять дополнительные вычисления для каждого делаемого прогноза, они не могут улучшить производительность для каждого токена, думая дольше»,-пишут исследователи.

Для разжигания изображений EBTS достигла лучших результатов, чем DIT, используя на 99% меньше проходов вперед.

Важно отметить, что исследование показало, что EBTS обобщается лучше, чем другие архитектуры. Даже с той же или худшей производительностью предварительной подготовки, EBTS превзошел существующие модели по нисходящим задачам. Повышение производительности от мышления System 2 было наиболее существенным по данным, которые были дополнительно перераспределяются (отличающиеся от данных обучения), что позволяет предположить, что EBT особенно надежны, когда сталкиваются с новыми и сложными задачами.

Исследователи предполагают, что «преимущества мышления EBTS не являются однородными для всех данных, а масштабируют масштабируют величину распределительных сдвигов, подчеркивая мышление как критический механизм для надежного обобщения за пределами обучающих распределений».

Преимущества EBT важны по двум причинам. Во -первых, они предполагают, что в масштабном масштабе современных моделей фундамента EBTS может значительно превосходить классическую архитектуру трансформатора, используемую в LLMS. Авторы отмечают, что «в масштабах современных моделей фундамента, обученных на 1000 раз больше данных с моделями на 1000 раз больше, мы ожидаем, что производительность EBT предварительно преодолевает значительно лучше, чем рецепт Transformer ++».

Во -вторых, EBT показывают гораздо лучшую эффективность данных. Это критическое преимущество в эпоху, когда высококачественные учебные данные становятся основным узким местом для масштабирования ИИ. «Поскольку данные стали одним из основных ограничивающих факторов в дальнейшем масштабировании, это делает EBT особенно привлекательными», — заключает документ.

Несмотря на различный механизм вывода, архитектура EBT очень совместима с трансформатором, что позволяет использовать их в качестве замены для текущих LLMS.

«EBT очень совместимы с текущими оборудованием/фреймворками вывода»,-сказал Гладстон, включая спекулятивное декодирование с использованием моделей подачи на GPU или TPU. Он сказал, что также уверен, что они могут работать на специализированных акселераторах, таких как алгоритмы LPU и оптимизации, такие как Flashattention-3, или могут быть развернуты через общие рамки вывода, такие как VLLM.

Для разработчиков и предприятий сильные возможности обоснования и обобщения EBT могут сделать их мощной и надежной основой для создания следующего поколения приложений ИИ. «Мышление дольше может в целом помочь практически во всех предприятиях, но я думаю, что наиболее интересным будут те, которые требуют более важных решений, безопасности или приложений с ограниченными данными», — сказал Гладстон.

Источник

1
…
15
16
17
18
19
…
41