Автор

admin

Как ИИ помогает бизнесу — от автоматизации до повышения продуктивности

admin 21.08.2025

admin

Искусственный интеллект помогает компаниям оптимизировать процессы и сократить затраты, позволяя сосредоточить ресурсы на более критически важных задачах.

Как ИИ помогает бизнесу - от автоматизации до повышения продуктивности

Используя алгоритмы и анализируя огромные массивы данных, ИИ способен выявлять закономерности и разрабатывать пошаговые подходы для решения различных задач.

Подобно человеку, ИИ учится на опыте, чтобы в будущем применять более эффективные методы. Хотя искусственному интеллекту предстоит еще долгий путь развития, многие компании уже используют его для выполнения задач, которые человек выполнял бы медленнее и с большей вероятностью ошибок.

Многие компании начали внедрять ИИ для оптимизации процессов и повышения общей производительности, сосредотачивая больше ресурсов на критически важных областях, в то время как ИИ берет на себя задачи в менее значимых отделах. Примером может служить автоматизированное обслуживание клиентов, где ИИ помогает быстрее решать проблемы клиентов через телефон, электронную почту или сообщения на сайте. Это позволяет компаниям экономить на затратах на персонал и направлять эти средства в другие области бизнеса.

Партнерство с ИИ с самого начала

От внедрения ИИ могут выиграть не только крупные компании, но и фрилансеры или малые предприятия. Для начинающих предпринимателей ИИ становится незаменимым партнером, способным быстро вывести их идеи на рынок. Первый шаг большинства бизнесов — создание веб-сайта, и это как раз то, что можно поручить ИИ.

ИИ может выступать в роли конструктора веб-сайтов и за короткое время создать уникальную онлайн-платформу, представляющую бизнес в выбранной сфере. Все, что нужно — это сообщить ИИ о предпочтениях и ключевых словах, и через короткое время у вас уже есть онлайн-присутствие. Конечно, вы всегда можете внести свои правки и дополнения.

Оптимизация процессов с первого дня

Для любого владельца бизнеса основная цель — добиться успеха, достигая поставленных целей. В прошлом для этого требовалось гораздо больше времени из-за необходимости выполнять множество ручных задач. Сегодня же, благодаря ИИ, предприниматели могут быть амбициозными с первого дня. ИИ помогает не только в создании сайта, но и в управлении административными задачами, бухгалтерией и другими аспектами бизнеса, в зависимости от отрасли.

Административные задачи

ИИ создан не для того, чтобы заменить человека, как это было показано в фильме «Я, робот». Он помогает в повседневных операциях. Ведение записей сотрудников и клиентов, архивирование предыдущих работ — все это остается рутинной задачей для любого бизнеса. На административном фронте ИИ может выполнять множество рутинных задач, таких как ведение календарей и отправка напоминаний о встречах.

ИИ может также использовать системы распознавания голоса для автоматического создания заметок с собраний и предоставления ответа клиентам, основываясь на установленных командах. Способность ИИ быстро распознавать и организовывать информацию делает его ценным инструментом для выполнения административных задач.

Бухгалтерия

Еще один важный аспект бизнеса — бухгалтерия. Будь вы фрилансером, выставляющим счета клиентам, или крупной компанией, важно обеспечивать стабильный денежный поток через своевременную отправку счетов. Здесь ИИ также может снять часть нагрузки.

Современные инструменты ИИ позволяют организовывать учетные записи, категоризировать транзакции и расходы, экономя ваше время. Важным аспектом бизнеса является и налоговая отчетность. ИИ способен справляться с налоговыми сложностями, анализировать, организовывать и отправлять необходимую информацию, чтобы бизнес оставался на правильной стороне законодательства. Благодаря этому и другим улучшениям, владельцы бизнеса могут сосредоточиться на росте и развитии.

Источник

Новости

Остановить тесты в лаборатории: арена включения показывает, как LLM работают в производстве

admin 21.08.2025

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Концентраторные модели тестирования стали важными для предприятий, что позволяет им выбирать тип производительности, которая резонирует с их потребностями. Но не все тесты построены одинаково, и многие тестовые модели основаны на статических наборах данных или средах тестирования.

Исследователи из Inclusion AI, который связан с Antibaba’s Ant Group, предложили новую модель лидеров и эталон, который больше фокусируется на производительности модели в реальных сценариях. Они утверждают, что LLMS нужна таблица лидеров, которая учитывает, как люди их используют и сколько людей предпочитают свои ответы по сравнению со статическими моделями возможностей знаний.

В статье исследователи изложили основу для арены включения, которая оценивает модели на основе предпочтений пользователей.

«Чтобы устранить эти пробелы, мы предлагаем Arena Inclusion Arena, живую таблицу лидеров, которая соединяет реальные приложения AI с современными LLMS и MLLM. В отличие от краудсорсинговых платформ, наша система случайным образом запускает модельные сражения во время многоводимовых диалогов человеческих и аивых приложений в RealWorld»,-говорится в документе.

Арена включения выделяется среди других модельных лидеров, таких как MMLU и OpenLLM, из-за его реального аспекта и его уникального метода ранжирования моделей. В нем используется метод моделирования Брэдли-Терри, аналогичный тому, который используется Chatbot Arena.

Включение Arena работает, интегрируя эталон в приложения AI, чтобы собрать наборы данных и провести человеческие оценки. Исследователи признают, что «количество первоначально интегрированных приложений с AI-двигателем ограничено, но мы стремимся создать открытый союз для расширения экосистемы».

К настоящему времени большинство людей знакомы с таблицами лидеров, а тесты, рекламирующие производительность каждого нового LLM, выпущенного такими компаниями, как Openai, Google или Anthropic. VentureBeat не привыкать к этим таблицам лидеров, поскольку некоторые модели, такие как Xai’s Grok 3, показывают свою мощь, возглавляя таблицу лидеров Chatbot Arena. Исследователи ИИ включения утверждают, что их новая таблица лидеров «обеспечивает оценки, отражающие практические сценарии использования», поэтому у предприятий есть лучшая информация о моделях, которые они планируют выбрать.

Использование метода Брэдли-Терри

Арена включения черпает вдохновение в Chatbot Arena, используя метод Брэдли-Терри, в то время как Chatbot Arena также использует метод ранжирования ELO одновременно.

Большинство таблиц лидеров полагаются на метод ELO, чтобы установить рейтинг и производительность. ELO ссылается на рейтинг ELO в шахматах, который определяет относительный навык игроков. И Эло, и Брэдли-Терри являются вероятностными рамками, но исследователи сказали, что Брэдли-Терри дает более стабильные рейтинги.

«Модель Брэдли-Терри обеспечивает надежную основу для вывода скрытых способностей из парных результатов сравнения»,-говорится в газете. «Тем не менее, в практических сценариях, особенно с большим и растущим числом моделей, перспектива исчерпывающего парного сравнения становится вычислительной и ресурсной и интенсивной ресурсной.

Чтобы сделать рейтинг более эффективным перед лицом большого количества LLMS, Arena Inclusion имеет два других компонента: механизм соответствия размещения и выборка близости. Механизм соответствия размещения оценивает первоначальный рейтинг для новых моделей, зарегистрированных для таблицы лидеров. Затем отбор близости ограничивает эти сравнения моделями в одной и той же области доверия.

Как это работает

Так как это работает?

Структура Inclusion Arena интегрируется в приложения с AI. В настоящее время на арене включения есть два приложения: приложение для чата персонажа Joyland и приложение для образовательной связи T-Box. Когда люди используют приложения, подсказки отправляются в несколько LLM за кулисами для ответов. Затем пользователи выбирают, какой ответ им нравится больше всего, хотя они не знают, какая модель сгенерировала ответ.

Структура рассматривает предпочтения пользователя для создания пар моделей для сравнения. Алгоритм Брэдли-Терри затем используется для расчета оценки для каждой модели, которая затем приводит к окончательному таблицу лидеров.

Включение ИИ ограничило свой эксперимент в данных до июля 2025 года, включающий 501 003 парных сравнений.

Согласно первоначальным экспериментам с ареной включения, наиболее эффективной моделью являются сонет Anpropic Claude 3.7, Deepseek V3-0324, Claude 3.5 Sonnet, Deepseek V3 и Qwen Max-0125.

Конечно, это были данные из двух приложений с более чем 46 611 активными пользователями, согласно документу. Исследователи сказали, что они могут создать более надежную и точную таблицу лидеров с большим количеством данных.

Больше лидеров, больше вариантов

Растущее число выпущенных моделей делает предприятиям более сложным выбирать, какие LLMS начать оценку. Таблицы лидеров и критерии направляют технических лиц, принимающих технические решения для моделей, которые могут обеспечить наилучшие результаты для их потребностей. Конечно, организации должны затем провести внутренние оценки, чтобы обеспечить эффективность LLMS для их приложений.

Это также дает представление о более широком ландшафте LLM, подчеркивая, какие модели становятся конкурентоспособными по сравнению с их сверстниками. Недавние тесты, такие как Rewardbench 2 из Института ИИ Аллен, пытаются выравнивать модели с реальными случаями использования для предприятий.

Источник

Новости

Первые впечатления от OpenAI o1: ИИ, созданный для глубоких размышлений

admin 20.08.2025

admin

OpenAI выпустила свои новые модели o1 в четверг, предоставив пользователям ChatGPT первую возможность опробовать ИИ, который «думает» перед тем, как ответить. Вокруг этих моделей, получивших кодовое название «Strawberry» внутри OpenAI, было много шума. Но оправдывает ли Strawberry ожидания?

Первые впечатления от OpenAI o1: ИИ, созданный для глубоких размышлений

Отчасти да.

По сравнению с GPT-4o, модели o1 кажутся шагом вперед и двумя шагами назад. OpenAI o1 превосходит предшественника в рассуждениях и ответах на сложные вопросы, но использование модели примерно в четыре раза дороже, чем GPT-4o. Последней модели OpenAI не хватает инструментов, мультимодальных возможностей и скорости, которые сделали GPT-4o столь впечатляющей. Фактически, OpenAI даже признает на своей странице помощи, что «GPT-4o по-прежнему остается лучшим вариантом для большинства запросов», и отмечает, что o1 испытывает трудности с более простыми задачами.

«Это впечатляет, но я думаю, что улучшение не очень значительное», — сказал Равид Шварц Зив, профессор Нью-Йоркского университета, изучающий модели ИИ. «Она лучше справляется с определенными задачами, но здесь нет повсеместного улучшения».

По всем этим причинам важно использовать o1 только для тех вопросов, для которых она действительно предназначена: больших и сложных. Стоит отметить, что большинство людей сегодня не используют генеративный ИИ для ответов на такие вопросы, в основном потому, что современные модели ИИ не очень хорошо с этим справляются. Однако o1 — это осторожный шаг в этом направлении.

Размышление над большими идеями

OpenAI o1 уникальна тем, что она «думает» перед тем, как ответить, разбивая большие проблемы на маленькие шаги и пытаясь определить, когда она правильно или неправильно выполняет один из этих шагов. Это «многоступенчатое рассуждение» не является полностью новым (исследователи предлагали его годами, а You.com использует его для сложных запросов), но до недавнего времени оно не было практичным.

«В сообществе ИИ царит большое волнение», — сказал в интервью Киан Катанфорош, генеральный директор Workera и адъюнкт-преподаватель Стэнфорда, который ведет курсы по машинному обучению. «Если вы можете обучить алгоритм обучения с подкреплением в сочетании с некоторыми методами языковой модели, которые есть у OpenAI, вы можете технически создать пошаговое мышление и позволить модели ИИ двигаться в обратном направлении от больших идей, которые вы пытаетесь проработать».

OpenAI o1 также уникально дорога. В большинстве моделей вы платите за входные и выходные токены. Однако o1 добавляет скрытый процесс (маленькие шаги, на которые модель разбивает большие проблемы), который добавляет большое количество вычислений, которые вы никогда полностью не видите. OpenAI скрывает некоторые детали этого процесса, чтобы сохранить свое конкурентное преимущество. Тем не менее, вам все равно приходится платить за это в виде «токенов рассуждения». Это еще раз подчеркивает, почему нужно быть осторожным при использовании OpenAI o1, чтобы не получить огромный счет за токены за вопрос о том, где находится столица Невады.

Тем не менее, идея модели ИИ, которая помогает вам «двигаться в обратном направлении от больших идей», очень мощная. На практике модель довольно хорошо с этим справляется.

В одном из примеров я попросил ChatGPT o1 preview помочь моей семье спланировать День благодарения — задачу, которая могла бы выиграть от небольшой беспристрастной логики и рассуждений. В частности, я хотел помощи в определении, будет ли двух духовок достаточно для приготовления ужина на День благодарения для 11 человек, и хотел обсудить, стоит ли рассмотреть возможность аренды Airbnb для получения доступа к третьей духовке.

После 12 секунд «размышлений» ChatGPT написал мне ответ объемом более 750 слов, в котором в конечном итоге говорилось, что двух духовок должно быть достаточно при тщательном планировании, и это позволит моей семье сэкономить на расходах и провести больше времени вместе. Но модель разложила свои мысли для меня на каждом этапе и объяснила, как она учитывала все эти внешние факторы, включая затраты, семейное время и управление духовками.

ChatGPT o1 preview рассказал мне, как распределить пространство в духовках в доме, где проходит мероприятие, что было умно. Странно, но она предложила рассмотреть возможность аренды переносной духовки на день. Тем не менее, модель работала намного лучше, чем GPT-4o, которая требовала нескольких дополнительных вопросов о том, какие именно блюда я собираюсь приготовить, а затем давала мне минимальные советы, которые я нашел менее полезными.

Вопрос о ужине в День благодарения может показаться глупым, но вы можете представить, насколько полезным этот инструмент мог бы быть для разбора сложных задач.

Я также попросил o1 помочь мне спланировать напряженный рабочий день, когда мне нужно было перемещаться между аэропортом, несколькими личными встречами в разных местах и моим офисом. Она дала мне очень подробный план, но, возможно, это было немного чересчур. Иногда все эти дополнительные шаги могут быть немного overwhelming.

Для более простого вопроса o1 делает слишком много — она не знает, когда прекратить overthinking. Я спросил, где можно найти кедровые деревья в Америке, и она выдала ответ объемом более 800 слов, описывая каждую разновидность кедрового дерева в стране, включая их научные названия. В какой-то момент она даже обратилась к политикам OpenAI, по какой-то причине. GPT-4o гораздо лучше справилась с этим вопросом, выдав мне примерно три предложения, объясняющие, что эти деревья можно найти по всей стране.

Умеряя ожидания

В некотором смысле Strawberry никогда не смогла бы оправдать ожидания. Сообщения о моделях рассуждений OpenAI датируются ноябрем 2023 года, как раз в то время, когда все искали ответ на вопрос, почему совет директоров OpenAI уволил Сэма Альтмана. Это запустило слухи в мире ИИ, заставив некоторых предположить, что Strawberry является формой AGI — просвещенной версии ИИ, которую OpenAI стремится в конечном итоге создать.

Альтман подтвердил, что o1 не является AGI, чтобы развеять все сомнения, хотя вы бы не были в этом уверены после использования этой штуки. Генеральный директор также умерил ожидания от этого запуска, написав в твиттере, что «o1 все еще несовершенна, все еще ограничена, и она все еще кажется более впечатляющей при первом использовании, чем после того, как вы проведете с ней больше времени».

Остальной мир ИИ смиряется с менее захватывающим запуском, чем ожидалось.

«Ажиотаж как бы вышел из-под контроля OpenAI», — сказал Рохан Пандей, исследователь-инженер из стартапа AI ReWorkd, который создает веб-скрапперы с использованием моделей OpenAI.

Он надеется, что способность o1 к рассуждениям достаточно хороша для решения узкого набора сложных проблем, в которых GPT-4 не справляется. Вероятно, именно так большинство людей в отрасли смотрят на o1, но не совсем как на революционный шаг вперед, который GPT-4 представляла для отрасли.

«Все ждут ступенчатого изменения возможностей, и неясно, представляет ли это такое изменение. Я думаю, все так просто», — сказал генеральный директор Brightwave Майк Коновер, который ранее участвовал в создании модели AI Dolly от Databricks, в интервью.

В чем ценность?

Основные принципы, использованные для создания o1, уходят корнями в прошлое на годы. Google использовала аналогичные методы в 2016 году для создания AlphaGo, первой системы ИИ, победившей чемпиона мира по настольной игре Го, как отмечает бывший сотрудник Google и генеральный директор венчурной фирмы S32 Энди Харрисон. AlphaGo тренировалась, играя против себя бесчисленное количество раз, по сути, самообучаясь, пока не достигла сверхчеловеческих способностей.

Он отмечает, что это вызывает давние дебаты в мире ИИ.

«Лагерь один считает, что вы можете автоматизировать рабочие процессы с помощью этого агентного процесса. Лагерь два считает, что если бы у вас был обобщенный интеллект и рассуждение, вам бы не нужен был рабочий процесс, и, как человек, ИИ просто принимал бы решение»,

— сказал Харрисон в интервью.

Харрисон говорит, что он в первом лагере, и что второй лагерь требует, чтобы вы доверяли ИИ принимать правильное решение. Он не думает, что мы уже там.

Однако другие рассматривают o1 не столько как принимающую решения, сколько как инструмент для проверки вашего мышления по поводу больших решений.

Катанфорош, генеральный директор Workera, описал пример, когда он собирался провести собеседование с дата-сайентистом для работы в его компании. Он говорит OpenAI o1, что у него есть только 30 минут, и он хочет оценить определенное количество навыков. Он может работать в обратном направлении с моделью ИИ, чтобы понять, правильно ли он об этом думает, и o1 будет понимать временные ограничения и тому подобное.

Вопрос в том, стоит ли этот полезный инструмент такой высокой цены. Поскольку модели ИИ продолжают дешеветь, o1 — одна из первых моделей ИИ за долгое время, которая стала дороже.

Англоязычный источник

Источник

Новости

11 полезных ИИ-инструментов для фрилансеров: как выбрать и использовать в 2025 году

admin 20.08.2025

admin

В 2025 году искусственный интеллект предлагает фрилансерам множество инструментов для оптимизации работы. Эксперты советуют тщательно подходить к выбору ИИ-решений и представляют 11 проверенных инструментов для различных задач: от автоматизации рутинных процессов до создания контента.

11 полезных ИИ-инструментов для фрилансеров: как выбрать и использовать в 2025 году

Начинающие фрилансеры часто сталкиваются с проблемой выбора инструментов для работы. На рынке представлены тысячи решений с искусственным интеллектом, и каждое позиционирует себя как незаменимое. Влиятельные лица в социальных сетях активно продвигают различные способы применения этих инструментов, вызывая у пользователей страх упустить что-то важное.

Как выбрать нужный инструмент

Прежде чем начать эксперименты с новыми ИИ-решениями, следует придерживаться простого алгоритма выбора:

Составьте список повседневных задач, включая маркетинг и административную работу
Определите области, где ИИ может сэкономить время и ресурсы
Оцените реальную необходимость инструмента для вашего этапа развития
Изучите отзывы на независимых площадках (G2, TechCrunch, TechRadar, Trustpilot)
Ознакомьтесь с обучающими материалами по использованию выбранного инструмента
Протестируйте решение на собственных проектах перед применением в клиентских заказах

Топ-11 ИИ-инструментов для фрилансеров

Социальные сети и контент

Tweet Hunter – развитие присутствия в Twitter
aiCarousels – создание карусели для LinkedIn и Instagram
Submagic – генерация короткого контента
Ossa AI – создание коротких видео без лица

Разработка и автоматизация

Blackbox – ускорение написания кода
Typedream AI – конструктор веб-сайтов
Bardeen – автоматизация без кода через расширение Chrome

Коммуникация и маркетинг

Chatsimple – создание чат-ботов для увеличения продаж
Superhuman – оптимизация работы с электронной почтой
Beehiiv – развитие рассылок
Julius – ИИ-аналитик для визуализации данных

Практическое применение

Все представленные инструменты имеют положительные отзывы на технологических площадках и решают различные задачи фрилансеров: от email-маркетинга до создания видеоконтента. Важно отметить, что эти решения можно использовать как для развития собственного бизнеса, так и для повышения качества услуг, предоставляемых клиентам.

Например, социальный медиа-менеджер может использовать aiCarousels не только для продвижения своих услуг, но и для повышения вовлеченности в профилях клиентов.

Источник

Новости

Редактирование QWEN-Image дает Photoshop за бег за свои деньги с помощью редакторов текста до искусственного интеллекта, которые работают в секундах

admin 20.08.2025

admin

Adobe Photoshop является одним из самых узнаваемых фрагментов программного обеспечения, когда -либо создаваемых, используемыми более чем 90% творческих профессионалов мира, согласно Photutorial.

Так что факт, что Новая модель ИИ с открытым исходным кодом -Qwen-Image Edit, выпущенная вчера китайским гигантом электронной коммерции Alibaba QWEN Team of AI-исследователей- Теперь в состоянии выполнить огромное количество работ с редактированием, похожими на Photoshop.это заметное достижение.

Построенная на модели фонда QWEN-Image на 20 миллиардов параметра, выпущенной ранее в этом месяце, QWEN-Image-Edit расширяет уникальные силы системы в текстовом рендеринге, чтобы охватить широкий спектр задач редактирования, от тонких изменений внешнего вида до более широких семантических преобразований.

Просто загрузите начальное изображение-я попробовал один из себя с последней ежегодной конференции Venturebeat в Сан-Франциско, а затем введите инструкции о том, что вы хотите изменить, и Qwen-Image-Edit вернет новое изображение с этими изменениями.

Пример входного изображения:

Фото предоставлено: Майкл О’Доннелл Фотография

Пример вывода изображения с помощью подсказки: «Сделайте мужчину в смокинге».

Модель доступна сейчас на нескольких платформах, включая Qwen ChatВ Обнимающееся лицоВ МоделикопВ GitHubи через Интерфейс программирования приложений Alibaba Cloud (API)последний, который позволяет любому стороннему разработчику или предприятию интегрировать эту новую модель в свои собственные приложения и рабочие процессы.

Я создал свои примеры выше на Qwen Chat, сопернике команды QWEN в CHATGPT OpenAI, однако для любого начинающих пользователей следует отметить, что поколения ограничены примерно 8 бесплатными заданиями (входные/выходы) в течение 12 часов до его сброса. Оплата пользователей может иметь доступ к большему количеству заданий.

При поддержке как английского, так и китайского входов, а также двойного внимания как к семантическому значению, так и на визуальной верности, QWEN-Image-Edit стремится снизить барьеры для создания визуального содержания профессионального класса.

И учитывая, что модель доступна в качестве открытого кода по лицензии Apache 2.0, для предприятий безопасно принимать, загружать и настраивать бесплатно на собственном оборудовании или виртуальных облаках/машинах, что может привести к огромной экономии затрат от проприетарного программного обеспечения, такого как Photoshop.

Как Junyang Lin, исследователь команды QWEN, написал на X: «Это может удалить прядь волос, очень тонкую модификацию изображения».

Наконец, последний кусок Qwen-Image, Qwen-Image-Edit. Боже мой, он может удалить прядь волос, очень тонкую модификацию изображения! Приходите и поиграйте с ним в Qwen Chat! https://t.co/fu3ofwshql
— Junyang Lin (@justinlin610) 18 августа 2025 года

Объявление команды перекликается с этим настроением, представляя QWEN-Image-Edicit не как совершенно новую систему, а как естественное расширение QWEN-Image, которое применяет свой уникальный текст и двойной подход непосредственно к редактированию задач.

Двойные кодировки позволяют сохранению стиля и содержания оригинального изображения

Qwen-image-edit основан на фундаменте, созданном Qwen-imageкоторый был представлен ранее в этом году как крупномасштабная модель, специализирующаяся на генерации изображений, так и на текстовом рендеринге.

Технический отчет QWEN-Image подчеркнул его способность выполнять сложные задачи, такие как текстовый текст уровня параграфа, китайские и английские персонажи, а также с несколькими линиями с точностью.

В отчете также подчеркнулся механизм двойного кодированияпитание изображений одновременно в QWEN2.5-VL для семантического контроля и вариационного автоэкодер (VAE) для реконструктивных деталей. Этот подход позволяет правок, которые остаются верными как для намерения подсказки, так и внешнего вида исходного изображения.

Те же самые архитектурные варианты лежат в основе qwen-image-edit. Используя двойные кодировки, модель может приспосабливаться к двум уровням: Семантические изменения это изменяет значение или структуру сцены, и внешний вид прав которые вводят или удаляют элементы, сохраняя остальные нетронутыми.

Семантическое редактирование Включает в себя создание новой интеллектуальной собственности, вращающиеся объекты 90 или 180 градусов, чтобы раскрыть различные представления или превратить вклад в другой стиль, такой как Studio, вдохновленное искусством. Эти редакторы обычно модифицируют многие пиксели, но сохраняют основную идентичность объектов.

Вот пример семантического редактирования от Shridhar Athinarayanan, инженера Replicate Platform Applications, который использовал реализацию или «вывод» QWEN, чтобы повторно сфотографировать Манхэттен, чтобы выглядеть как набор игрушек LEGO.

QWEN решил редактирование изображений

0,03 долл. США, 3 секунды за редактирование при репликации

Все идут найти другую проблему, чтобы решить лол pic.twitter.com/xgw8ujxgoh
— Шридхар (@shridharathi) 18 августа 2025 года

Редактирование внешнего вида Сосредоточится на точных местных изменениях. В этих случаях большая часть изображения остается неизменной, в то время как конкретные объекты изменяются. Демонстрации включают в себя добавление вывески, которая генерирует отражение в воде, удаление бездомных покрытий волос с портрета и изменение цвета одной буквы в текстовом изображении.

Один хороший пример редактирования внешнего вида с помощью QWEN-Image Edit приходит от соучредителя и генерального директора Respondai Томаса Хилла, который разместил на x бок о бок о своей жене в ее свадебном платье под аркой, а другая с той же аркой, покрытой граффити: граффити: граффити:

Жена попросила меня сделать свадебное фото более резким. Это весело! @replicate pic.twitter.com/0revjlvh3e
— Томас Хилл (@tomanswerai) 19 августа 2025 года

В сочетании с устоявшейся силой QWEN в виде китайского и английского текста, система редактирования, ориентированная на редактирование, позиционируется как гибкий инструмент для создателей, которым нужно больше, чем простые генеративные образы.

Двойной контроль над семантическим объемом и точностью внешнего вида означает, что один и тот же инструмент может служить очень разным потребностям, от творческого развития IP до ретуширования фотографий на уровне производства.

Добавление или удаление текста на изображения

Еще одна выдающаяся способность — это Двуязычное редактирование текстаПолем QWEN-IMAGE-EDIT позволяет пользователям добавлять, удалять или изменять текст как на китайском, так и на английском языке при сохранении шрифта, размера и стиля.

Это расширяет репутацию Qwen-Image для сильного текста, особенно в сложных сценариях, таких как сложные китайские иероглифы.

На практике это позволяет точно редактировать плакаты, знаки, футболки или произведения искусства каллиграфии, где имеют значение небольшие текстовые данные, как видно из другого примера из репликации ниже.

Мы обновили QWEN-Image-Edit, чтобы иметь лучшее качество и согласованность и по популярным соотношениям сторон.
— Джон (@johnrachwan) 19 августа 2025 года

Одна демонстрация включала исправление ошибок в кусочке сгенерированной китайской каллиграфии посредством пошагового процесса редактирования цепочек.

Пользователи могут выделять неправильные регионы, указать систему исправить их, а затем еще больше уточнить детали, пока не будут отображаться правильные символы. Этот итеративный подход показывает, как модель может быть применена к задачам редактирования с высокими ставками, где необходима точность.

Приложения и варианты использования

Команда QWEN выделила ряд потенциальных приложений:

Творческий дизайн и расширение IPнапример, генерирование пакетов смайликов на основе талисмана.
Реклама и создание контентагде могут быть настроены логотипы, вывески и текстовые визуальные эффекты.
Виртуальные аватары и искусствосо стилем переноса, поддерживающей уникальные представления персонажей.
Фотография и личное использованиев том числе настройки фона, изменения одежды и удаление объекта.
Культурное сохранениепродемонстрировано путем исправления классической каллиграфии.

Соединяя мелкозернистое редактирование с более широкими творческими преобразованиями, Qwen-Image-Edit обслуживает профессионалов, которые нуждаются в контроле, оставаясь доступным для случайных экспериментов.

Бесборивание и производительность

По данным команды QWEN, оценки в общедоступных критериях показывают, что Qwen-Image-Edit обеспечивает Современная производительность в редактировании изображения.

Это следует из более широких технических оценок QWEN-Image, где базовая модель достигла ведущих результатов как в общих задачах генерации изображений, так и в задачах рендеринга текста.

В то время как конкретные эталонные показатели редактирования не были подробно описаны в выпуске, сам QWEN-Image высоко оценивал независимые оценки, такие как AI Arena, где оценщики человека сравнивали результаты по моделям разных поставщиков.

Цены и доступность API

Через Alibaba Cloud Model Studioразработчики могут получить доступ к Qwen-Image-Edit в качестве API. Цены установлены на $ 0,045 за изображениес бесплатной квотой 100 изображений действительны в течение 180 дней После активации.

Сервис изначально доступен в Сингапурский регионс ограничением скорости пять запросов в секунду и до две одновременные задачи на счетПолем

Чтобы использовать API, разработчики должны получить ключ Model Studio API и могут вызвать модель через HTTP или через DashScope SDK в Python или Java.

Изображения могут быть представлены в виде URL -адресов или в формате Base64, с поддерживаемыми разрешениями в диапазоне от 512 до 4096 пикселей и размерами файлов до 10 МБ. Выходные изображения размещаются в хранилище облачных объектов Alibaba со ссылками, действительными в течение 24 часов, требуя, чтобы пользователи быстро загружали и сохраняли результаты.

Что дальше для Qwen?

QWEN позиционирует изображение-редакцию как шагD Снижение барьеров для создания визуального контента. Сделав точное, подсудимое стиль, редактирование более доступным, модель может поддерживать приложения от Design Studios до случайных пользователей, усовершенствовавших личные проекты.

Система также сигнализирует о более широкой тенденции в разработке искусственного интеллекта: выходя за рамки одноцелевого поколения в сторону инструментов, которые интегрируют редактирование, коррекцию и уточнение.

Как семантическая гибкость, так и точность на уровне внешнего вида, QWEN-Image-Edit отражает этот сдвиг, смешивая генеративные силы крупных моделей с надежностью, необходимой для профессионального редактирования.

Источник

Новости

Агент для масштабирования агента безопасно — и остановка следующего большого нарушения безопасности

admin 20.08.2025

admin

Представлено Gravitee

Растет разрыв между амбициями ИИ и готовностью к эксплуатации, поскольку предприятия участвуют в гонках, чтобы доказать ценность с ИИ перед их конкурентами. По словам Рори Бланделла, генерального директора Gravitee, все растущее число агентов ИИ развернута и действуют без ограждений, и это будет иметь серьезные последствия, а не позже, говорит Рори Бланделл, генеральный директор Gravitee.

«Организации спешат реализовать агенты искусственного интеллекта без необходимых структур безопасности или структурированных процессов адаптации», — объясняет Бланделл. «В результате мы полагаем, что существует высокая вероятность того, что в течение следующих нескольких лет будет серьезное нарушение данных, вызванное агентом, действующим за пределами его предполагаемой подачи, независимо от того, неосознанно или из -за надзора со стороны его человеческих операторов. Это риск того, что предприятия должны опережать сейчас, пока не стало слишком поздно».

Согласно недавнему состоянию агентского ИИ, 72% организаций уже используют агентские системы ИИ. Кроме того, 75% респондентов называют управление своим главным заботой. Тем не менее, многие мировые лидеры бизнеса по -прежнему не до конца понимают широту рисков, присущих их агентским экспериментам, особенно в связи с тем, что количество агентов, которые они развертывают, складывается.

А риски из ускорен агент разрастает

Проблемы агента разразились теперь повторяют те ранние дни API: отдельные команды раскручивают своих собственных агентов для решения конкретных задач, от чат -ботов до автоматизации рабочего процесса, но без централизованного плана. Вскоре агенты взаимодействуют с LLMS, запускают действия или используют конфиденциальные инструменты и данные, все без общего надзора или видимости в отношении производительности, осанки безопасности или затрат, и последствия могут быть далеко.

«У вас будет точно такая же проблема с услугами и микро-сервисами 10 или 15 лет назад»,-говорит Бланделл. «Поскольку больше агентов создаются без централизованного контроля, становится почти невозможным контролировать их поведение, гарантировать, что они действуют эффективно или поддерживают критическую безопасность во всех взаимодействиях, происходящих все время между инструментами, LLM и агентами. Затем вы плохо контролируют агентов с протоколами столкновения и неконтролируемым поведением, которые сдерживают скорость к инновациям, системам усиления, и фактически определяют, а не в солице.

Скорость против инноваций

Давно созданные предприятия с десятилетиями мер по безопасности, управлению и контролю до AI, которые уже возникают еще одну задачу: сбалансировать строгие протоколы безопасности для агентов и их обогнать конкурентов, которые более быстрее и ловли, или бросающие агенты на стене и видят, что прилипает. Те компании, которые спешат в драку, могут подвергать себя серьезным риску, но интересно, что они также продвигаются гораздо быстрее.

«Если у вас еще нет необходимых мер безопасности или правильно структурированный способ представить больше агентов, вы идете на самоцензуру, а скорость уменьшится»,-говорит Бланделл. «Поэтому вы рискуете, что бизнес не способен достичь того, чего он должен достичь, и рисковать вашей общей компанией.

Роль централизованного управления и контроля

Теперь можно решить все эти проблемы одновременно с помощью централизованного уровня управления, который обеспечивает видимость в целой агентской системе через унифицированный интерфейс. Размещение такого решения, как агент Gravitee Agent, может значительно ускорить инновации почти сразу же, особенно после того, как организация решает проблемы эффективности, вызванные перегруженными, неэффективными агентами, которые монополизируют ресурсы.

Сетка подкреплена безопасным протоколом связи, потому что агенты столь же полезны, как и их способность координировать и безопасно обмениваться данными. Он использует открытый протокол Google-Agent-Agent (A2A): проект с открытым исходным кодом, разработанный Google Cloud в партнерстве с 50+ другими компаниями, включая Gravitee. Протокол A2A управляет безопасным обменом информацией и скоординированными действиями среди автономных агентов искусственного интеллекта, независимо от того, соответствуют ли их базовые технологии или структуру, что позволяет им обнаружить, аутентифицировать безопасность и сотрудничать, обеспечение защиты организаций.

Протокол A2A и другие инструменты управления агентами, такие как агент Gravitee, предназначены для сокращения дублирования, а также политики обеспечения соблюдения. И он добавляет наблюдаемость и порядок, которые обеспечивают управление многоагентными экосистемами, эффективными и выровненными с внутренней политикой.

Когда управление вступает в игру

Учитывая текущие темпы энтузиазма ИИ и экспериментов, большинство организаций не начинают свое агентское путешествие по ИИ с управлением — при этом они не должны, особенно на ранних этапах, говорит Бланделл. Тем не менее, четырехэтапная модель зрелости готовности ИИ может помочь направить бизнес-прогресс:

Первый этап: Доказательство концепции и экспериментов
Стадия второй: Включение инструментов и LLMS, а также использование одного агента
Этап третий: Многоагентное развертывание
Четвертый этап: Полностью управляемые, наблюдаемые и безопасные многоагентные экосистемы

В то время как ИИ инструменты и LLM становятся все более обычным явлением, настоящие многоагентные архитектуры остаются редкими. Большинство организаций сегодня падают где -то между этапами первого и второго, говорит Блунделл, и именно там они должны быть, продолжая тестировать, учиться и экспериментировать, прежде чем наслоение в управлении.

«Оставление управления на более позднюю стадию может показаться противоречивым, но на самом деле это не будет иметь смысла, если вы не начнете понимать, что ИИ в первую очередь значит для вашей организации», — объясняет он. «Наша рекомендация состоит в том, чтобы пройти все начальные этапы готовности ИИ и раннего агента, подтверждающего концепции, выяснить, где вписываются агенты и как, прежде чем вы рассмотрите стратегию управления. Вы не хотите быть заблокированным в рамках, которая не работает для многоагентной архитектуры, которая работает для вашего бизнеса».

Организация, захватывающая беспорядочную, не борьбу, многоагентную архитектуру, может подключить существующие API-агентства агента непосредственно к сетке агента Gravitee, без какого-либо риска к тому, как функционирует эта архитектура.

«Обновление до агента сетки требует очень короткого периода времени, чтобы направить все в нужные места и централизовать ваших агентов, начать мониторинг производительности и обеспечивать соблюдение лучших практик», — говорит он. «А потом вы разблокировали способность ускоряться до полной зрелости AI».

Копайте глубже: узнать больше о роли управления и контроля при надрубке инноваций ИИ, и Почему наблюдение имеет решающее значение для агентской стратегии, которая быстро доставляет, Посетите здесь.

Кроме того, Gravitee проводит саммит A2A для лидеров, навигающих на агентском ИИ 6 ноября 2025 года в Нью -Йорке, в партнерстве с Фондом Linux. В этом мероприятии будет изучено будущее оркестровки и автономных предприятий агента (A2A), объединяя лидеры технологических лидеров из Google, Microsoft, Gartner и других, чтобы предоставить действенные идеи, чтобы помочь организациям справиться с агентом разрастать и раскрыть весь потенциал принятия решений AI. Узнайте больше здесь.

Спонсируемые статьи — это контент, производимый компанией, которая либо платит за пост, либо имеет деловые отношения с VentureBeat, и они всегда четко обозначены. Для получения дополнительной информации свяжитесь с sales@venturebeat.com.

Источник

Новости

Как ChatGPT может предсказать ваше будущее: 5 практических советов

admin 20.08.2025

admin

Вы сомневаетесь в своих решениях, а подсказки о вашем будущем уже скрыты в ваших собственных словах. Пять продуманных запросов к ChatGPT помогут вам проанализировать свой путь, выявить сильные стороны и устранить слабости.

Как ChatGPT может предсказать ваше будущее: 5 практических советов

Каждое ваше действие и каждая идея, которыми вы делитесь в диалогах с ChatGPT, формируют детальную карту ваших интересов, навыков и амбиций. Даже если вам кажется, что вы блуждаете в поисках решений, ваш цифровой помощник уже анализирует ваш опыт и может стать ключом к пониманию вашего будущего. На основе ваших взаимодействий с ИИ можно выявить закономерности, которые подскажут, куда направить усилия и как максимизировать ваш потенциал. Представляем пять эффективных запросов, которые помогут вам открыть новые горизонты.

Запрос 1: Определите свой карьерный путь

Каждая выполненная задача, каждая идея, зажигающая вас, несут информацию о том, где ваши сильные стороны могут быть наиболее востребованы. Чтобы понять это, спросите:

«На основании наших бесед проанализируй мою текущую карьерную траекторию. Какие направления вызывают у меня интерес, какие навыки я развиваю? Назови три возможных карьерных пути, которые логично соответствуют моим интересам, и предложи шаги для их реализации в ближайшие три года».

Этот запрос позволит глубже взглянуть на свои увлечения и ресурсы, чтобы выбрать направление, которое не только соответствует вашим талантам, но и поможет достичь успеха.

Запрос 2: Выявите ключевые сильные стороны

Каждая трудность, которую вы преодолеваете, и каждая задача, которую решаете, формируют ваши ключевые навыки. Важно понимать, какие из них будут наиболее востребованными в ближайшем будущем. Чтобы разобраться, задайте вопрос:

«Какие из моих сильных сторон, по твоему мнению, будут наиболее ценными через 2-3 года? Подскажи, как я могу ускорить их развитие, начиная с конкретных шагов в этом месяце».

Понимание ваших ключевых навыков — это не только способ эффективно планировать, но и путь к тому, чтобы использовать возможности максимально эффективно.

Запрос 3: Анализ вашей сети контактов

Успех зачастую зависит не только от ваших усилий, но и от того, кого вы выбираете своим партнером или советником. Чтобы понять, какие связи уже играют важную роль и какие стоит развивать, попробуйте такой запрос:

«На основе наших бесед проанализируй мои деловые отношения. Какие типы людей идеально подходят для сотрудничества со мной? Какие изменения стоит ожидать в моей сети контактов, и каких людей мне следует привлекать для достижения успеха в будущем?»

С помощью такого анализа вы сможете наметить стратегию для создания прочного круга контактов, которые будут поддерживать вас на пути к цели.

Запрос 4: Обнаружьте свои слабые стороны

Даже самые успешные люди сталкиваются с трудностями, вызванными их собственными «слепыми зонами». Слабые места, оставленные без внимания, могут затормозить прогресс. Чтобы избежать этого, уточните у ИИ:

«Какие три возможных слабых стороны могут повлиять на мой успех? Что я могу сделать в течение ближайших шести месяцев, чтобы их устранить?»

Раннее выявление проблемных зон позволяет не только эффективно решать задачи, но и предвосхищать потенциальные препятствия.

Запрос 5: Найдите свой фокус

Тема, которая вас вдохновляет, или проблема, которую вы хотите решить, — это подсказки, указывающие на вашу уникальную зону гениальности. Чтобы понять, в какой области вы можете добиться максимального влияния, спросите:

«Какие три области, на основе наших разговоров, могут стать зонами моего наибольшего влияния? Какие шаги мне предпринять, чтобы реализовать свой потенциал в этих сферах?»

Определив свой фокус, вы сможете не только эффективно распределять ресурсы, но и достичь выдающихся результатов.

Выводы

Ваша история общения с ChatGPT — это мощный инструмент для самопознания и планирования. Используя эти запросы, вы получите представление о своих сильных сторонах, слабостях, потенциальных возможностях и необходимых связях. Прекратите гадать о своих следующих шагах — ответы уже перед вами, нужно лишь правильно их расшифровать.

Источник

Новости

Nvidia выпускает новую небольшую открытую модель Nemotron-Nano-9B-V2 с рассуждением включения/выключения переключения/выключения

admin 19.08.2025

admin

Маленькие модели имеют момент. По пятам выпуска новой модели AI Vision, достаточно маленькой, чтобы вписаться в умные часы от MIT -побочного жидкого искусственного интеллекта, и модель достаточно маленькой, чтобы работать на смартфоне от Google, Nvidia присоединяется к вечеринке сегодня с собственной моделью с новой маленькой языком (SLM), Nemotron-Nano-9b-V2который достиг высочайшей производительности в своем классе на выбранных критериях и поставляется с возможностью для пользователей переключать и выключать «рассуждения», то есть самостоятельно, перед выводом ответа.

В то время как 9 миллиардов параметров больше, чем некоторые из многомиллионных параметров Small ModelNvidia отмечает, что это значимое сокращение от его первоначального размера 12 миллиардов параметров и предназначен для подгонки на Одиночный графический процессор NVIDIA A10Полем

Как сказал Oleksii Kuchiaev, директор NVIDIA по модели AI пост-тренировок, в ответ на вопрос, который я поместил ему: «12B был обрезан до 9b, чтобы специально подготовить A10, который является популярным выбором GPU для развертывания. Это также гибридная модель, которая позволяет ему обрабатывать больший размер партии и быть в 6 раз быстрее, чем модели трансформаторов аналогичного размера ».

Для контекста многие ведущие LLM находятся в диапазоне параметров 70 миллиардов (параметры отзывов относятся к внутренним настройкам, регулирующим поведение модели, в более широком смысле обозначают более крупную и более способную, но в то же время более интенсивную вычислительную модель).

Модель обрабатывает несколько языков, включая английский, немецкий, испанский, французский, итальянский, японский и в расширенных описаниях, корейских, португальских, русских и китайских. Это подходит для обоих следующая инструкция и генерация кода.

Nemotron-Nano-9B-V2 и его наборы данных перед тренировками доступны прямо сейчас по обниманию лица и через модельный каталог компании.

Слияние трансформатора и архитектур мамбы

Он основан на Nemotron-H, наборе гибридных моделей мамба-трансформатора, которые составляют основу для последних предложений компании.

В то время как большинство популярных LLM — это чистые «трансформаторные» модели, которые полностью полагаются на слои внимания, они могут стать дорогостоящими по памяти и вычислять по мере роста длины последовательности.

Вместо этого, модели Nemotron-H и другие, использующие архитектуру Mamba, разработанную исследователями из Университета Карнеги-Меллона и Принстона, также Плетение в селективных космических моделях состояния (или SSM), которые могут обрабатывать очень длинные последовательности информации внутри и выходить, поддерживая состояние.

Эти слои линейно масштабируются с длиной последовательности и могут обрабатывать контексты гораздо дольше, чем стандартное самопринятие без той же памяти и вычислительных накладных расходов.

A hYbrid Mamba-Transformer снижает эти затраты, заменяя большую часть внимания космосом линейного времени, достигая до 2–3 × выше пропускной способности в длинных контекстах с сопоставимой точностью.

Другие лаборатории искусственного интеллекта за пределами Nvidia, такие как AI2, также выпустили модели на основе архитектуры Mamba.

Переключить/рассуждения об использовании языка

Nemotron-Nano-9b-V2 позиционируется как унифицированный чат только для текста и модель рассуждений, обученная с нуля.

А Система по умолчанию создает след рассуждений, прежде чем предоставить окончательный ответ, хотя пользователи могут переключать это поведение через простые управляющие токены, такие как /Think или /no_think.

Модель также яntroduces rewtime runtime «Бюджет мыслительного бюджета»который Позволяет разработчикам ограничить количество токенов посвящен внутренним рассуждениям перед моделью завершит ответ.

Этот механизм направлен на сбалансировку точности с задержкой, особенно в таких приложениях, как поддержка клиентов или автономные агенты.

Тесты рассказывают многообещающую историю

Результаты оценки подчеркивают конкурентную точность против других открытых мелких моделей. Протестировано в режиме «рассуждать» с использованием набора Nemo Skills, Nemotron-Nano-9b-V2 достигает 72,1 процента на AIME25В 97,8 процента по математике 500, 64,0 процента на GPQAи 71,1 процента на livecodebenchПолем

Оценки по следующим инструкциям и давно контекстовые тесты также сообщаются: 90,3 процента на ifeval, 78,9 процента на тесте правителя 128Kи меньшие, но измеримые успехи на BFCL V3 и HLE Clarkmark.

По всем направлениям, Nano-9B-V2 показывает более высокую точность, чем QWEN3-8B, Общая точка сравнения.

NVIDIA иллюстрирует эти результаты с кривыми точностью и бюджетами, которые показывают, как производительность масштабируется как токеновое разрешение на рассуждение увеличивается. Компания предполагает, что тщательный контроль бюджета может помочь разработчикам оптимизировать как качество, так и задержку в сценариях использования производства.

Обученный на наборе данных синтетических данных

Как модель Nano, так и семейство Nemotron-H полагаются на смесь кураторских данных по веб-источникам и синтетическим обучением.

Корпуса включают общий текст, код, математику, науку, юридические и финансовые документы, а также наборы данных в стиле выравнивания.

NVIDIA подтверждает использование синтетических следов рассуждений, генерируемых другими крупными моделями для укрепления производительности на сложных критериях.

Лицензирование и коммерческое использование

Модель Nano-9B-V2 выпускается в соответствии с лицензионным соглашением Nvidia Open Model, которое в последний раз обновляется в июне 2025 года.

Лицензия предназначена для разрешений и предприятия. Nvidia явно заявляет, что модели коммерчески полезно из коробкии это Разработчики могут свободно создавать и распространять производные модели.

Важно отметить, что NVIDIA не требует права собственности на какие -либо результаты, генерируемые моделью, оставляя ответственность и права с разработчиком или организацией, использующими ее.

Для разработчика предприятия это означает, что модель может быть введена в производство немедленно без переговоров по отдельной коммерческой лицензии или оплате сборов, связанных с порогами использования, уровнями доходов или количества пользователей. Не существует предложений, требующих оплачиваемой лицензии, когда компания достигнет определенной масштаба, в отличие от некоторых многоуровневых открытых лицензий, используемых другими поставщиками.

Тем не менее, соглашение включает в себя несколько условий, которые должны соблюдать предприятия:

Ограждения: Пользователи не могут обойти или отключать встроенные механизмы безопасности (называемые «ограждениями») без реализации сопоставимых замен, подходящих для их развертывания.
Перераспределение: Любое перераспределение модели или производных должно включать в себя текст и атрибуцию лицензии Nvidia Open Model («Лицензировано NVIDIA Corporation по лицензии NVIDIA Open Model»).
Согласие: Пользователи должны соблюдать торговые правила и ограничения (например, законы об экспорте США).
Достоверные условия ИИ: Использование должно соответствовать NVIDIA, заслуживающему доверия Руководства по ИИ, которые охватывают ответственное развертывание и этические соображения.
Судебная сфера: Если пользователь инициирует авторское право или патентные судебные разбирательства против другого организации, утверждая, что модель утверждает, что лицензия автоматически завершается.

Эти условия сосредоточены на юридическом и ответственном использовании, а не на коммерческом масштабе. Предприятиям не нужно искать дополнительные разрешения или платить роялти в NVIDIA просто за создание продуктов, монетизацию их или масштабирование своей пользовательской базы. Вместо этого они должны убедиться, что практика развертывания уважает безопасность, атрибуцию и обязательства по соответствию.

Позиционирование на рынке

С Nemotron-Nano-9B-V2 NVIDIA нацелена на разработчиков, которым нужен баланс мышления и эффективность развертывания в меньших масштабах.

Функции управления бюджетом времени выполнения и рассуждения предназначены для обеспечения строителей системы большую гибкость в управлении точностью в зависимости от скорости отклика.

Их освобождение от обнимающего лица и модельного каталога NVIDIA указывает на то, что они предназначен для того, чтобы быть широко доступным для экспериментов и интеграции.

Выпуск Nvidia Nemotron-Nano-9B-V2 демонстрирует постоянное внимание к эффективности и контролируемым рассуждениям в языковых моделях.

Объединив гибридные архитектуры с новыми методами сжатия и обученияКомпания предлагает инструменты разработчиков, которые стремятся поддерживать точность при одновременном снижении затрат и задержки.

Источник

Новости

GEPA оптимизирует LLM без дорогостоящего подкрепления

admin 19.08.2025

admin

Исследователи из Калифорнийского университета, Беркли, Стэнфордского университета и DataBricks представили новый метод оптимизации ИИ под названием GEPA, который значительно превосходит традиционные методы обучения (RL) для адаптации крупных языковых моделей (LLMS) к специализированным задачам.

GEPA устраняет популярную парадигму обучения через тысячи испытательных и ошибочных попыток, руководствуясь простыми численными оценками. Вместо этого он использует собственное понимание языка LLM, чтобы подумать о своей производительности, диагностике ошибок и итеративно развивать свои инструкции. В дополнение к более точным, чем установленные методы, GEPA значительно более эффективен, достигая превосходных результатов с в 35 раз меньше пробных прогонов.

Для предприятий, создающих комплексные агенты ИИ и рабочие процессы, это переводится непосредственно в более быстрые циклы разработки, значительно более низкие вычислительные затраты и более эффективные, надежные приложения.

Высокая стоимость оптимизации современных систем ИИ

Современные приложения ИИ предприятия редко представляют собой единый вызов LLM. Это часто представляют собой «составные системы ИИ», сложные рабочие процессы, которые цеполивают несколько модулей LLM, внешние инструменты, такие как базы данных или переводчики кода, и пользовательская логика для выполнения сложных задач, включая многоэтапные исследования и анализ данных.

Популярный способ оптимизации этих систем — это методы обучения подкреплениянапример, групповая относительная оптимизация политики (GRPO), метод, используемый в моделях популярных рассуждений, включая DeepSeek-R1. Этот метод рассматривает систему как черный ящик; Он выполняет задачу, получает простую метрику успеха («скалярное вознаграждение», как оценку 7/10) и использует эту обратную связь, чтобы медленно подталкивать параметры модели в правильном направлении.

Основным недостатком RL является его неэффективность образца. Чтобы эффективно учиться на этих редких численных оценках, методы RL часто требуют десятков тысяч или даже сотен тысяч пробных прогонов, известных как «развертывания». Для любого реального корпоративного приложения, которое включает в себя дорогие звонки инструментов (например, запросы API, компиляция кода) или используют мощные проприетарные модели, этот процесс является непомерно медленным и дорогостоящим.

Как сказал VentureBeat, как Лакшья, соавтор бумаги и докторантуру в Калифорнийском университете в Беркли, эта сложность является основным барьером для многих компаний. «Для многих команд RL не является практичным из-за его стоимости и сложности-и их подход до сих пор часто бывал вручную вручную»,-сказал Агравал. Он отметил, что GEPA предназначена для команд, которым необходимо оптимизировать системы, созданные на моделях высшего уровня, которые часто нельзя настраивать, что позволяет им повысить производительность без управления пользовательскими кластерами графических процессоров.

Исследователи создают эту проблему следующим образом: «Как мы можем извлечь максимальный сигнал обучения из каждого дорогостоящего развертывания, чтобы обеспечить эффективную адаптацию сложных модульных систем ИИ в условиях с низким содержанием данных или ограниченным бюджетом?»

Оптимизатор, который учится с языком

GEPA (Genetic-Pareto)-это быстрый оптимизатор, который решает эту проблему, заменяя редкие награды на богатую, естественную обратную связь. Он использует тот факт, что все выполнение системы ИИ (включая ее шаги рассуждения, вызовы инструментов и даже сообщения об ошибках) может быть сериализовано на текст, который LLM может читать и понимать. Методология GEPA построена на трех основных столпах.

Во -первых, это «генетическая оперативная эволюция», где GEPA относится к популяции подсказок, как генный пул. Это итеративно «мутирует» подсказки для создания новых, потенциально лучших версий. Эта мутация является интеллектуальным процессом, обусловленным вторым столпом: «Отражение с обратной связью естественного языка». После нескольких развертываний GEPA предоставляет LLM с полным следом выполнения (что система пыталась сделать) и результатом (что пошло правильно или неправильно). Затем LLM «отражает» эту обратную связь на естественном языке, чтобы диагностировать проблему и написать улучшенную, более подробную подсказку. Например, вместо того, чтобы просто видеть низкий балл по задаче генерации кода, он может проанализировать ошибку компилятора и прийти к выводу, что подсказка должна указать конкретную версию библиотеки.

Третий столб-«выбор на основе Парето», который обеспечивает умное исследование. Вместо того, чтобы сосредоточиться только на единственной подсказке, которая может привести к тому, что застрять в неоптимальном решении («локальный оптимум»), GEPA поддерживает разнообразный состав «специализированных» подсказок. Он отслеживает, что побуждает лучше всего работать в разных отдельных примерах, создавая список лучших кандидатов. Отбор проб из этого разнообразного набора стратегий выигрыша, GEPA гарантирует, что она изучает больше решений и, скорее всего, обнаружит подсказку, которая хорошо обобщается в широком диапазоне входов.

Выбор одного лучшего кандидата (слева) может привести к тому, что модели застряли в локальных минимумах, в то время как выбор Парето (справа) может изучить больше вариантов и найти оптимальные решения Источник: arxiv

Эффективность всего этого процесса зависит от того, что исследователи называют «инженерией обратной связи». Агравал объясняет, что ключом является появление богатых, текстовых деталей, которые системы уже производят, но часто отказываются. «Традиционные трубопроводы часто уменьшают эту деталь до одной численной награды, скрывая, почему происходят конкретные результаты», — сказал он. «Основное руководство GEPA состоит в том, чтобы структурировать обратную связь, которая вызывает не только результаты, но и промежуточные траектории и ошибки в простом тексте — те же доказательства, которые человек использовал бы для диагностики поведения системы».

Например, для системы поиска документа это означает, что какие документы были извлечены правильно, а какие были пропущены, а не просто рассчитывать окончательный балл.

Гепа в действии

Исследователи оценили GEPA по четырем разнообразным задачам, в том числе ответом на вопрос с несколькими ходами (Hotpotqa) и конфиденциальность, сохраняющие конфиденциальность (куколка). Они использовали как модели с открытым исходным кодом (QWEN3 8B), так и проприетарные (GPT-4.1 MINI) модели, сравнивая GEPA с GRPO на основе RL и современного быстрого оптимизатора MIPROV2.

Во всех задачах GEPA в значительной степени превзошла GRPO, достигнув более высокого балла до 19%, используя в 35 раз меньше развертываний. Agrawal представила конкретный пример этого повышения эффективности: «Мы использовали GEPA для оптимизации системы QA за ~ 3 часа по сравнению с 24 часами GRPO — сокращение времени разработки на 8 раз, а также достиг на 20% более высокую производительность», — пояснил он. «Оптимизация на основе RL того же сценария в нашем тесте стоимостью около 300 долларов США во время графического процессора, в то время как GEPA стоит менее 20 долларов США за лучшие результаты-15 раз в наших экспериментах».

*GEPA превосходит другие базовые показатели на ключевых критериях источника: arxiv*

Помимо необработанной производительности, исследователи обнаружили, что оптимизированные GEPA системы более надежны, когда сталкиваются с новыми, невидимыми данными. Это измеряется с помощью «разрыва в обобщении» (разница между производительностью по данным обучения и конечными данными тестирования). Агравал предполагает, что это потому, что Гепа учится на более богатой обратной связи. «Меньший разрыв в обобщении GEPA может быть связан с использованием богатых отзывов о естественном языке по каждому результату-что сработало, что потерпело неудачу и почему-а не полагаться исключительно на одну скалярную награду»,-сказал он. «Это может поощрять систему разработать инструкции и стратегии, основанные на более широком понимании успеха, а не просто обучения моделям, характерным для данных обучения». Для предприятий эта улучшенная надежность означает менее хрупкие, более адаптируемые приложения для ИИ в ролях, связанных с клиентами.

Основным практическим преимуществом является то, что подсказки GEPA, основанные на инструкциях, в 9,2 раза короче, чем подсказок, производимые оптимизаторами, такими как Miprov2, которые включают в себя много нескольких выстрелов. Более короткие подсказки уменьшают задержку и снижают затраты на модели на основе API. Это делает окончательное приложение быстрее и дешевле в производстве.

В документе также представлены многообещающие результаты для использования GEPA в качестве стратегии поиска «время вывода», превращая ИИ из генератора с одним ответом в итеративный решатель проблем. Агравал описал сценарий, в котором GEPA может быть интегрирован в трубопровод CI/CD компании. Когда новый код будет совершен, GEPA может автоматически генерировать и усовершенствовать несколько оптимизированных версий, проверить их на производительность и открыть запрос на вытяжение с наилучшим вариантом для инженеров для просмотра. «Это превращает оптимизацию в непрерывный, автоматизированный процесс-нарастающе генерируя решения, которые часто соответствуют или превосходят экспертную настройку рук»,-отметил Агравал. В своих экспериментах по генерации кода CUDA этот подход повысил производительность на 20% задач до экспертного уровня по сравнению с 0% для одной попытки GPT-4O.

Авторы газеты считают, что GEPA является основополагающим шагом к новой парадигме развития ИИ. Но помимо создания более человеческого искусственного интеллекта, его наиболее непосредственное воздействие может быть на то, кто может построить высокоэффективные системы.

«Мы ожидаем, что GEPA обеспечит положительный сдвиг в построении системы искусственного интеллекта, что создает оптимизацию таких систем, доступных для конечных пользователей, которые часто обладают опытом домена, относящейся к задаче, но не обязательно время и готовность изучать сложные специфики RL»,-сказал Агравал. «Это дает власть непосредственно заинтересованным сторонам с точными знаниями в области домены».

Источник

Новости

Как ИИ меняет способность людей думать самостоятельно

admin 19.08.2025

admin

Новые исследования показали, что использование искусственного интеллекта (ИИ) может снижать способность людей критически мыслить. Хотя ИИ экономит время и ресурсы, он также способствует «когнитивной разгрузке», что может привести к снижению самостоятельности в решении задач.

Как ИИ меняет способность людей думать самостоятельно

Влияние искусственного интеллекта на повседневную жизнь, работу и бизнес хорошо изучено, однако его воздействие на человеческий мозг только начинает раскрываться. Новое исследование, опубликованное в журнале Societies, поднимает важный вопрос: как ИИ влияет на критическое мышление?

Когнитивная разгрузка: что это и как связано с ИИ?

Исследователи из Швейцарской бизнес-школы (SBS) под руководством Майкла Герлиха изучили, как использование ИИ связано с когнитивной разгрузкой — процессом, при котором люди полагаются на технологии для снижения умственных усилий. Такой подход может быть удобным, но он приводит к снижению самостоятельных навыков, например, в решении задач или запоминании.

В рамках исследования 666 участников из разных возрастных групп и уровней образования прошли опросы и интервью. Они регулярно использовали ИИ в повседневной жизни. Ученые выяснили, что люди с высоким уровнем образования чаще проверяют данные, предоставленные ИИ, в то время как менее образованные пользователи полностью полагаются на технологии.

«Я использую ИИ почти для всего, будь то выбор ресторана или принятие рабочего решения. Это экономит время, но я боюсь, что теряю способность думать так глубоко, как раньше», — отметил один из участников исследования.

Возрастная зависимость и когнитивные навыки

Исследование выявило, что молодые пользователи ИИ (от 17 до 25 лет) сильнее полагаются на технологии, чем старшие поколения. Это делает их более уязвимыми к снижению критического мышления. Вместе с тем, участники всех возрастов выразили беспокойство по поводу влияния ИИ на их когнитивные способности.

«Иногда мне кажется, что, имея всю информацию под рукой, я перестаю чему-либо учиться или что-то запоминать. Я настолько привык полагаться на ИИ, что вряд ли смогу решить некоторые задачи без него», — поделился молодой респондент.

Баланс использования ИИ

Несмотря на преимущества ИИ в экономии времени и улучшении эффективности, ученые подчеркивают необходимость сохранения критических навыков. Это особенно важно для адаптации в условиях быстро меняющегося мира.

Герлих и его команда предлагают интеграцию ИИ в образовательные программы с акцентом на развитие самостоятельности. Они призывают учителей и политиков находить баланс между использованием технологий и развитием когнитивных способностей.

«ИИ должен дополнять, а не заменять человеческие задачи», — заключил Герлих.

Источник