Категория:

Новости

Gamesbeat Summit 2025: Может ли ИИ повысить творчество в разработке игр?

admin 16.06.2025

admin

https://www.youtube.com/watch?v=yidz6vtofsa

На Summit 2025 Gamesbeat 2025 игры и генеративный ИИ — особенно модели трансформатора, модели с большими языками и модели генерации изображений — были особенно горячей темой. Крис Мелиссинос, главный евангелист-видеоигры и иммерсивные технологии в AWS, приветствовал Аарона Фарра, соучредителя и технического директора Jam & Tea Studios; Эшвин Рагураман, старший архитектор решений, игры в AWS; и Хилари Мейсон, соучредитель и генеральный директор Hidden Door, чтобы изучить творческий потенциал ИИ в играх.

ИИ демонстрирует повышение производительности в рабочих процессах разработки, но может ли он добавить аналогичные преимущества к творческой стороне игрового дизайна?

По словам Мейсона, это нюансированный вопрос с довольно нюансированным ответом.

«Это не большая красная кнопка« Сделать игру », точно, но это то, что позволяет нам задавать вопросы», — сказала она. «Наши функции затрат изменились, наши функции возможностей изменились. То, что мы можем позволить нашим игрокам, изменились. Каков творческий опыт, который мы можем придумать и попробовать? Может быть, мы можем построить немного быстрее, чем мы могли бы раньше. Это не черно -белый вопрос об искусственном интеллекте, который делает меня игрой. Это немного более насыщенный вопрос о том, что я могу сделать с этим, что я не могу сделать раньше, или что я хотел бы сделать это, но не так, как это, но не так, как это.

Фарр согласился, сказав, что еще не время выбросить ваши старые инструменты.

«Мы еще не готовы, если мы когда -нибудь будем, нажмите кнопку и получите игру», — сказал он. «У меня есть репертуар инструментов. Что это добавляет к нему? Где он заполняет пробелы? Я не выбрасываю все старые инструменты. Мне нужна возврат инвестиций. В то же время я бы посоветовал людям не преждевременно оптимизировать. Я знаю, что затраты страшны. Вот почему у нас есть замечательные партнеры, которые могут помочь нам находить на эти расходы, но я также поощряю людей, чтобы поощрять люди, чтобы вы могли поощрять люди. это.»

Творческое обещание генеративного ИИ

Gen AI предлагает новые возможности в дизайне, прототипировании и построении построения повествования, особенно для небольших или экспериментальных студий, и ускоряет творчество.

«В некотором смысле это автоматизирует леса, которая позволяет художнику, писателю, кто -то делает дизайн уровня, иметь возможность затем войти во что -то, не создавая все части снизу вверх», — сказал Мелиссинос. «Вы в основном даете им возможность создать больше искусства и больше истории, потому что вы удалили некоторые из этих произведений. Это не заменяет художника. Это ускоряет их результаты, ускоряет их эффективность. Или это может. В некоторых случаях, если вы не осторожны и не проверяете свои собственные предвзятости, вы думаете, это именно то, что я представлял! Всегда проверяете свои предвзятые. Всегда проверяете результаты. Всегда проверяете их. Всегда можно увидеть.

Вам нужно опираться на все аспекты технологии, включая странности и неожиданные, добавил Фарр.

«В некоторых случаях галлюцинации означают творчество», — сказал он. «Мы можем накапливаться с такими ударами во многих творческих способах. Но это означает, что вы должны иметь интуицию о том, что такое эта технология. У нас все еще есть искушение сказать, что я знаю, как работают эти модели. Я собираюсь просто применить их снова. Я бы сказал, что это может быть новым средством, что мы начинаем объяснять, или настаивать на том, что наша среда когда -либо, и что мы должны придерживаться того, чтобы мы были применены, и что мы Применение этого — это то, к чему мы призываем ».

Это все еще включает в себя все вещи, которые делают игры великолепными: разработчики, которые думают и сочувствуют игрокам, которые думают о том, что приносит радость их идеальной аудитории, как выглядит лучший опыт и чувствует себя. Конечно, вы не можете количественно оценить веселье или намерение, сказал Мелисинос, и вы не можете разгрузить это на машины.

Hidden Door не использует искусство, созданное AI, в своей игровой платформе, но она использует ИИ для динамической сборки искусства, созданного человеком, поскольку разработчики создают уровни и персонажей.

«Мы не говорим, вообще нет машинного обучения в художественном процессе», — сказала она. «Мы много думаем о визуальном опыте в конце. Как мы можем достичь этого наиболее эффективного, учитывая те активы, которые у нас есть, и о времени, которое у нас есть?»

Jam & Tea Studios также не использует искусство, сгенерированное AI, в розничном маге, а вместо этого сделала этический выбор, чтобы полагаться на рыночные активы и заказанное искусство-так как это дешевле. Их основная цель с генеративным ИИ — творческие инновации.

«Мы пытаемся применить эту технологию способами, которые создают что -то новое и новое, что мы не могли сделать раньше», — сказал он. «Ни один человек, ни один из дизайнеров повествования, никто не мог бы создать то, что мы делаем».

Демократизация развития игры с облаком + AI

По словам Рагурамана, доступ к масштабируемым, предварительному моделям также удаляет барьеры для небольших команд и сольных разработчиков.

«Существуют разные уровни инструментов, которые предназначены для некоторых разработчиков, таких как ученые данных», — сказал он. «Люди, которые имеют возможность погрузиться в данные и погрузиться в код. В то же время есть разработчики, которые, возможно, не такими ориентированы на технологии. Они хотят просто включить эту технологию в свой игру, в свой опыт».

Это означает, что генеративное ИИ меняет не только то, как производятся игры, но и для участия в творческом процессе. Такие инструменты, как Amazon Bedrock, управляемый сервис для строительства, обучения и тонкой настройки LLM на AWS, являются своего рода игровой площадкой для LLMS, позволяя разработчикам экспериментировать и выбирать инструменты, которые будут наилучшим образом соответствовать их потребностям.

По словам Рагурамана, на самом деле нет прямой науки, чтобы выяснить, какая модель работает лучше всего, но коренная порода демократизирует возможности на всеобъемлющей платформе, которая оптимизирует доступ к передовым генеративным моделям ИИ, разработанным такими компаниями, как AI21 Labs, Anpropic и Stability AI. Эти модели обучаются массивным наборам данных, что позволяет им выполнять широкий спектр задач. Он использует унифицированный API, который выступает в качестве переводчика для разработчиков, работающих со сложными моделями.

«Так вы используете эти LLM в качестве инструмента, а не только а Инструмент, но один из инструментов в вашем инструментальном поясе, — сказал Рагураман. — Это помогает ускорить это время до производства или времени, чтобы иметь модель или изображение, которое вам действительно нравится — что ваши игроки также понравится ».

Источник

Новости

Просто добавьте людей: Оксфордское медицинское исследование подчеркивает недостающую ссылку в тестировании чат -ботов

admin 16.06.2025

admin

Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

Заголовки распыляли его в течение многих лет: модели крупных языков (LLMS) могут не только сдавать медицинские лицензионные экзамены, но и превосходить людей. GPT-4 мог бы правильно ответить на вопросы о лицензировании медицинского обследования США в 90% случаев, даже в доисторические дни AI 2023 года. С тех пор LLMS стали лучшими жителями, сдав эти экзамены и лицензированные врачи.

Перейдите, доктор Google, упустите место для Chatgpt, MD, но вы можете захотеть больше, чем диплом от LLM, который вы развертываете для пациентов. Как и студент -медик ACE, который может набрать название каждой кости в руке, но обморок на первом виде настоящей крови, мастерство медицины LLM не всегда переводится непосредственно в реальный мир.

Документ исследователей из Оксфордского университета показал, что, хотя LLMS может правильно идентифицировать соответствующие условия в 94,9% случаев, когда они непосредственно представлены с тестовыми сценариями, участники человека, использующие LLMS для диагностики тех же сценариев, выявили правильные условия менее 34,5% времени.

Возможно, даже более примечательно, что пациенты, использующие LLMS, выполняли даже хуже, чем контрольная группа, которая была просто указала диагностировать себя, используя «любые методы, которые они обычно используют дома». Группа, оставленная на своих собственных устройствах, была на 76% чаще выявлять правильные условия, чем группа, которым помогает LLMS.

Оксфордское исследование поднимает вопросы о пригодности LLM для медицинских советов и критериях, которые мы используем для оценки развертывания чат -ботов для различных приложений.

Угадай, твоя болезнь

Во главе с доктором Адамом Махди исследователи из Оксфорда наняли 1298 участников, чтобы представить себя пациентами в LLM. Им было поручено, что они пытались выяснить, что их способствовало, и соответствующим уровням заботы о том, чтобы искать его, начиная от самообслуживания до вызова машины скорой помощи.

Каждый участник получил подробный сценарий, представляющий условия от пневмонии до простуды, наряду с деталями общей жизни и историей болезни. Например, в одном сценарии описывается 20-летний инженерный студент, у которого на ночь наносит ужесточительную головную боль с друзьями. Он включает в себя важные медицинские детали (больно смотреть вниз) и красные сетью (он обычный пьющий, разделяет квартиру с шестью друзьями и только что закончил несколько стрессовых экзаменов).

Исследование проверило три разных LLM. Исследователи выбрали GPT-4O из-за его популярности Llama 3 за его открытые веса и командование R+ для его способностей поиска-аугментированного поколения (RAG), которые позволяют ему поискать в открытом Интернете.

Участникам было предложено взаимодействовать с LLM, по крайней мере, один раз, используя предоставленные детали, но они могли использовать их столько раз, сколько они хотели бы прийти к их самодиагностике и предполагаемым действиям.

За кулисами команда врачей единогласно определила условия «золотого стандарта», которые они искали в каждом сценарии, и соответствующий курс действий. Например, наш инженерный студент страдает от субарахноидального кровоизлияния, которое должно повлечь за собой немедленное визит в отделение скорой помощи.

Игра по телефону

Хотя вы можете предположить, что LLM, который может получить медицинское обследование, будет идеальным инструментом, чтобы помочь обычным людям самодиагностировать и выяснить, что делать, это не сработало. «Участники, использующие LLM, выявили соответствующие условия менее последовательно, чем в контрольной группе, выявляя по меньшей мере одно соответствующее условие не менее 34,5% случаев по сравнению с 47,0% для контроля», — говорится в исследовании. Они также не смогли вывести правильный курс действий, выбрав его всего 44,2% времени, по сравнению с 56,3% для LLM, действующего независимо.

Что пошло не так?

Оглядываясь назад на стенограммы, исследователи обнаружили, что участники предоставили неполную информацию LLMS, и LLMS неверно истолковали свои подсказки. Например, один пользователь, который должен был проявлять симптомы желчных камней, просто сказал LLM: «У меня сильные боли в животе, длившие до часа, это может заставить меня рвать и, кажется, совпадает с выводом», опуская местоположение боли, тяжести и частоты. Команда R+ неправильно предположил, что участник испытывал расстройство желудка, и участник неправильно угадал это условие.

Даже когда LLMS предоставила правильную информацию, участники не всегда следовали ее рекомендациям. Исследование показало, что 65,7% разговоров GPT-4O предположили, по крайней мере, одно соответствующее условие для сценария, но каким-то образом менее 34,5% окончательных ответов от участников отражали эти соответствующие условия.

Человеческая переменная

Это исследование полезно, но не удивительно, по словам Натали Волхаймер, специалиста по пользовательским опыту в Институте эпохи эпохи эпохи (RENCI), Университет Северной Каролины в Чапел -Хилл.

«Для тех из нас достаточно взрослых, чтобы вспомнить первые дни поиска в Интернете, это дежавю», — говорит она. «В качестве инструмента, крупные языковые модели требуют, чтобы подсказки были написаны с определенной степенью качества, особенно при ожидании качества выпуска».

Она отмечает, что кто -то, испытывающий ослепительную боль, не предложит отличных подсказков. Хотя участники лабораторного эксперимента не испытывали симптомов напрямую, они не передавали каждую деталь.

«Существует также причина, по которой клиницисты, которые имеют дело с пациентами на линии фронта, обучаются задавать вопросы определенным образом и определенной повторяемости», — продолжает Волкгеймер. Пациенты опускают информацию, потому что они не знают, что актуально или, в худшем случае, лгут, потому что они смущены или стыдно.

Могут ли чат -боты быть лучше разработаны для их решения? «Я бы не стал акцентом на машины», — предупреждает Волкхаймер. «Я бы рассмотрел акцент на взаимодействии с человеческим технологиями». Автомобиль, как она аналогична, была построена, чтобы заставить людей из пункта A до B, но многие другие факторы играют роль. «Речь идет о водителе, дорогах, погоде и общей безопасности маршрута. Это не только до машины».

Лучший критерий

Оксфордское исследование подчеркивает одну проблему не с людьми или даже LLM, а с тем, как мы их иногда измеряем — в вакууме.

Когда мы говорим, что LLM может сдать медицинский лицензированный тест, экзамен по лицензированию на недвижимость или экзамен по состоянию на государственный банк, мы расследуем глубину ее базы знаний, используя инструменты, предназначенные для оценки людей. Тем не менее, эти меры очень мало рассказывают нам о том, как успешно эти чат -боты будут взаимодействовать с людьми.

«Подсказки были учебником (как подтверждено источником и медицинским сообществом), но жизнь и люди не являются учебником», — объясняет доктор Волхаймер.

Представьте себе предприятие, которое собирается развернуть вспомогательный чат -бот, обученный ее внутренней базе знаний. Один, казалось бы, логичный способ проверить, что бот может просто провести тот же тест, который компания использует для стажеров поддержки клиентов: отвечать на предварительные вопросы поддержки «клиента» и выбор ответов с несколькими вариантами ответов. Точность 95%, безусловно, будет выглядеть довольно многообещающей.

Затем приходит развертывание: реальные клиенты используют расплывчатые термины, выражают разочарование или описывают проблемы неожиданным образом. LLM, одержимый только по четким вопросам, запутывается и предоставляет неверные или бесполезные ответы. Он не был обучен и не оценивался по деэскаляции ситуаций или эффективно разъяснения. Сердитые отзывы накапливаются. Запуск является катастрофой, несмотря на то, что LLM плыл через тесты, которые казались надежными для его человеческих коллег.

Это исследование служит критическим напоминанием для инженеров ИИ и специалистов по оркестровке: если LLM предназначен для взаимодействия с людьми, полагаясь исключительно на неинтерактивные критерии, может создать опасное ложное чувство безопасности о своих возможностях реального мира. Если вы проектируете LLM для взаимодействия с людьми, вам нужно проверить его с людьми, а не тесты для людей. Но есть ли лучший способ?

Использование ИИ для тестирования ИИ

Оксфордские исследователи набрали почти 1300 человек для своего исследования, но у большинства предприятий нет места испытаний, сидящих вокруг, ожидая, чтобы играть с новым агентом LLM. Так почему бы просто не заменить тестеров искусственного интеллекта для человеческих тестеров?

Махди и его команда тоже попробовали это с моделируемыми участниками. «Вы пациент», — побудили они LLM, отделенную от того, который даст советы. «Вы должны самостоятельно оценить свои симптомы из данного случая виньетки и помощи из модели ИИ. Упростить терминологию, используемую в данном параграфе к языку непрофессионала, и сохранить ваши вопросы или заявления разумно короткими». LLM также был проинструктирован не использовать медицинские знания и не создавать новые симптомы.

Эти моделируемые участники затем болтали с теми же LLMS, которые использовали участники человека. Но они выступили намного лучше. В среднем моделируемые участники, использующие те же инструменты LLM, прибили соответствующие условия в 60,7% времени по сравнению с менее 34,5% у людей.

В этом случае оказывается, что LLMs играют лучше с другими LLM, чем люди, что делает их плохим предиктором реальной работы.

Не вините пользователя

Учитывая, что результаты LLM могут достичь самостоятельно, может быть заманчиво обвинить участников здесь. В конце концов, во многих случаях они получали правильные диагнозы в своих беседах с LLMS, но все же не смогли правильно угадать. Но это было бы безрассудным выводом для любого бизнеса, предупреждает Волхеймер.

«В каждой среде клиента, если ваши клиенты не делают то, что вы хотите, последнее, что вы делаете, это вините клиента», — говорит Волкхеймер. «Первое, что вы делаете, это спросите, почему. А не« почему »вне вашей головы: но глубокий следственный, конкретный, антропологический, психологический, изученный« почему ». Это ваша отправная точка ».

Польхеймер предполагает, что вам нужно понять свою аудиторию, их цели и качество обслуживания клиентов, прежде чем развернуть чат -бот. Все это проинформирует тщательную, специализированную документацию, которая в конечном итоге сделает LLM полезной. Без тщательно кураторских учебных материалов, «он выплюнет какой -то общий ответ, который ненавидят, которые ненавидят, поэтому люди ненавидят чат -ботов», — говорит она. Когда это происходит, «это не потому, что чат -боты ужасны или потому, что с ними что -то технически что -то не так. Это потому, что вещи, которые в них вошли, плохо».

«Люди, разрабатывающие технологии, разрабатывая информацию, чтобы прийти туда, и процессы и системы, ну, в общем, люди», — говорит Волхеймер. «У них также есть фон, предположения, недостатки и слепые пятна, а также сильные стороны. И все эти вещи могут быть встроены в любое технологическое решение».

Источник

Новости

Искусственный интеллект: от фантастической идеи к повседневной реальности

admin 16.06.2025

admin

Искусственный интеллект, или ИИ – это способность компьютерных систем выполнять задачи, которые обычно требуют человеческого интеллекта. Сегодня ИИ активно применяется в самых разных сферах нашей жизни. Но как зародилась эта удивительная технология и какие этапы прошла на пути к своему нынешнему уровню?

Искусственный интеллект: от фантастической идеи к повседневной реальности

Предыстория: зарождение идеи

Еще в древности люди мечтали о создании искусственного разума. Так, в древнегреческой мифологии есть история о Пигмалионе, скульпторе, который создал статую настолько прекрасную, что влюбился в нее. Мечты об искусственном человеке появляются в литературе, начиная с 16 века.

Однако только в 20 веке, с развитием компьютерных технологий, эти мечты получили шанс воплотиться в реальность. В 1950 году математик Алан Тьюринг опубликовал статью «Вычислительные машины и интеллект», в которой описал принципы создания мыслящей машины. Этот труд положил начало практическим исследованиям в области ИИ.

Интересный факт: именно Тьюринг предложил известный «тест Тьюринга» — метод проверки способности компьютера мыслить как человек.

Рождение новой науки (1956 год)

В 1956 году произошло знаменательное событие, давшее толчок развитию всей отрасли. На конференции в Дартмутском колледже впервые прозвучал термин «искусственный интеллект», а ведущие ученые подписали декларацию о намерении создать мыслящую машину.

На конференции были представлены первые программы, демонстрирующие элементы интеллектуального поведения, такие как логический вывод и решение задач. Эта встреча ознаменовала рождение новой научной дисциплины — искусственного интеллекта.

Первые успехи и разочарования (1960-1970 гг)

В 1960-1970 годы исследования в области ИИ активно продвигались вперед. Были созданы первые интеллектуальные программы для игры в шахматы, решения логических задач, перевода текстов. Однако вскоре стало ясно, что изначальные ожидания были завышены.

Машины с трудом справлялись даже с простыми задачами, которые люди решают без усилий. Многие исследователи разочаровались в перспективах ИИ. Наступил период застоя, который продлился около 20 лет.

Возрождение ИИ (конец 20 века)

Новое дыхание в ИИ вдохнули достижения в области нейронных сетей и машинного обучения. Появились алгоритмы глубокого обучения, которые позволили компьютерам эффективно анализировать большие данные и самостоятельно находить закономерности.

Эти методы дали толчок развитию таких важных направлений, как компьютерное зрение и распознавание речи. Например, в 1997 году компьютер Deep Blue впервые обыграл чемпиона мира по шахматам. А в 2011 году система Watson победила лучших игроков в интеллектуальную телеигру Jeopardy. Такие победы ИИ над человеком в сложных интеллектуальных состязаниях ознаменовали новую эру в развитии технологии.

ИИ сегодня: вокруг нас

Сегодня применение ИИ вышло далеко за пределы научных лабораторий и охватывает множество сфер повседневной жизни. Интеллектуальные помощники, такие как Siri, Алиса или Google Assistant, понимают речь и могут выполнять простые команды. Системы распознавания изображений помогают тегировать фото в соцсетях. Рекомендательные сервисы предлагают персонализированный контент. Автопилоты на основе ИИ уже тестируются автопроизводителями.

Что дальше?

Несмотря на впечатляющий прогресс, искусственный интеллект все еще значительно уступает человеческому в гибкости мышления и способности к обучению. Создание машин, равных людям по интеллектуальным возможностям, — это задача будущего. Но ИИ уже стал неотъемлемой частью нашей жизни и будет играть еще бóльшую роль по мере развития технологий. Какие новые горизонты откроет перед нами эта удивительная область науки?

Источник

Новости

Claude — персональный AI-помощник от Anthropic для естественного диалога

admin 16.06.2025

admin

Claude — относительно новый чат-бот от Anthropic с возможностями естественного диалога. Обучен безопасному и полезному поведению с помощью Constitutional AI. Claude был представлен публике около полутора лет назад и на текущий момент является одним из наиболее передовых и безопасных чат-ботов, созданных на основе принципов Constitutional AI

Claude — персональный AI-помощник от Anthropic для естественного диалога

Компания Anthropic, основанная бывшими инженерами Google и OpenAI, недавно представила свою новую разработку — искусственный интеллект Claude. Этот чат-бот был создан с помощью технологии Constitutional AI, которая позволяет обучать ИИ безопасному и полезному поведению.

Компания Anthropic была основана в 2021 году бывшими инженерами Google и OpenAI Даниэлем Кане и Дарио Амодео. Они сосредоточились на создании искусственного интеллекта нового типа — Constitutional AI, который изначально ограничен безопасным и полезным поведением.

Claude предназначен для естественного диалога с людьми на различные темы. Он может поддерживать беседу, отвечать на вопросы, переспрашивать в случае непонимания, а также отказываться от неподобающих или опасных действий. Для обучения Claude использовался большой объем текстовых данных, а также специальные методы интерактивного обучения.

В отличие от предыдущих Чат-ботов, Claude обладает гораздо более широкими возможностями для естественного диалога. Он может не только отвечать на простые вопросы, но и поддерживать беседу на абстрактные темы. При этом Claude контролирует безопасность своих ответов и старается избегать токсичного, предвзятого или вводящего в заблуждение поведения.

Anthropic позиционирует Claude как персонального AI-ассистента для общения. В дальнейшем компания планирует использовать Constitutional AI для создания полезных чатботов в образовании, медицине, customer service и других областях. Уже сейчас Claude доступен для тестирования на сайте anthropic.com.

Первый публичный релиз чат-бота Claude состоялся в феврале 2022 года. На тот момент он был доступен лишь ограниченному кругу тестировщиков. В июне 2022 Claude стал доступен для свободного общения на сайте anthropic.com. По состоянию на сентябрь 2023 Claude продолжает активно развиваться командой Anthropic, расширяя свои возможности для естественного диалога.

Вот несколько ключевых особенностей, которыми Claude выделяется среди других чат-ботов:

Он бесплатный, но в Российском сегменте доступен только с использованием VPN.
Естественный диалог — Claude способен поддерживать беседу на разные темы, а не просто отвечать на базовые вопросы. Он может переспрашивать для уточнения деталей, подхватывать тему разговора и так далее.
Широкий охват знаний — Claude обучен на большом объеме текстов из разных источников, поэтому может вести диалог на абстрактные и неожиданные темы, выходящие за рамки базовых фактов.
Безопасность — с помощью технологии Constitutional AI Claude контролирует безопасность своих ответов, не допуская токсичности, предвзятости и вводящих в заблуждение высказываний.
Контекстный диалог — Claude может учитывать контекст и историю предыдущего диалога, вместо того, чтобы отвечать изолированно на каждую реплику.
Мультиязычность — в отличие от многих чат-ботов, Claude поддерживает не только английский, но и другие языки, включая русский.

Claude нацелен на более естественное и полезное общение по сравнению с ограниченными по возможностям чат-ботами.

Источник

Новости

Будущее нейросетей в игровой индустрии. Плюсы, минусы, перспективы ИИ

admin 15.06.2025

admin

Нейросети и машинное обучение все чаще применяются в современных компьютерных играх. Нейросеть — это математическая модель, которая по структуре имитирует нейронные связи в мозге. Она состоит из искусственных нейронов, объединенных в слои, и способна на основе обучающих данных самостоятельно находить закономерности и выполнять задачи.

Будущее нейросетей в игровой индустрии. Плюсы, минусы, перспективы ИИ

Машинное обучение позволяет автоматически улучшать алгоритмы нейросети в процессе работы. Технологии искусственного интеллекта открывают новые возможности для создания умных игровых механик, поведения персонажей, процедурной генерации контента. Это дает играм большую глубину и реиграбельность. Давайте подробнее разберем применение нейросетей в играх.

Использование нейросетей в играх

В игровой индустрии нейронные сети активно используются для:

Моделирования поведения компьютерных противников. Нейросети позволяют создавать интересное и разнообразное поведение NPC, их реакции на действия игрока.
Генерации игровых миров и локаций. С помощью нейросетей можно процедурно создавать уникальные уровни, ландшафты, здания вместо ручного дизайна.
Балансировки игры. Настройка параметров персонажей, предметов, заклинаний — это сложная задача. Нейросети помогают анализировать данные и находить оптимальный баланс.
Персонализации игрового процесса под конкретного игрока, адаптации под его стиль, предпочтения и модели поведения.
Улучшения графики с помощью технологий машинного обучения. Например, использование нейросетей для апскейлинга изображений в реальном времени.
Реализации сложного ИИ для управления неигровыми персонажами, например, жителями города.
Генерации реалистичных диалогов и сюжетных линий с помощью нейросетей на основе больших текстовых массивов.

Разработка нейросетей требует от команды тщательной подготовки — сбора данных, выбора архитектуры, оптимизации и отладки моделей. Рассмотрим подробнее этот процесс.

Разработка нейросетей для игр

Выбор архитектуры нейросети — очень важный этап. Нужно подобрать такую архитектуру (количество слоев, нейронов, функций активации), которая решит поставленную задачу, но не будет слишком ресурсоемкой.
Подготовка данных для обучения нейросети — трудоемкий процесс. Данные должны быть релевантными, качественными и в достаточном объеме. Зачастую требуется их сбор и разметка вручную.
Выбор фреймворков и библиотек для построения и обучения нейросети. Популярные решения — TensorFlow, PyTorch, Keras и другие.
Оптимизация — нейросети требуют значительных вычислительных ресурсов. Необходима оптимизация, чтобы модель работала в режиме реального времени.
Интеграция нейросети в игровой движок. Сложный этап, часто приходится оптимизировать движок под новую функциональность.
Тестирование и отладка — поиск ошибок в логике, данных, коде. Часто нейросеть ведет себя странно из-за неверных настроек или недостатка данных.

Плюсы и минусы использования нейросетей

Внедрение нейросетей в игровую индустрию имеет как плюсы, так и минусы

Плюсы:

Более интересное поведение NPC
Уникальный генерируемый контент
Адаптивность под пользователя
Новые возможности геймдизайна

Минусы:

Сложность в разработке и отладке
Требовательность к ресурсам
«Черный ящик» — сложно проследить логику
Риск непредсказуемого поведения

Кейсы от разработчиков игр

Рассмотрим несколько примеров реального применения нейросетей в популярных играх:

Для шутера Doom была разработана нейросеть, управляющая поведением демонов. Она динамически меняла тактику монстров в зависимости от действий игрока.
В игре StarCraft 2 нейросети использовались для улучшения стратегии компьютерных противников. Модели анализировали тысячи реальных матчей людей.
Нейросеть DeepMind смогла достичь профессионального уровня в StarCraft 2, обыграв лучших игроков.
ИИ Watson от IBM помог разработчикам Shadow of War создать уникальные характеры и диалоги для компьютерных персонажей.
В Sims 4 нейросети генерируют естественные диалоги NPC на основе образа и предпочтений персонажа.
Алгоритмы машинного обучения в FIFA 22 моделируют реалистичное поведение футболистов.

Эти примеры наглядно демонстрируют возможности нейронных сетей для улучшения игр. Многие компании всё больше инвестируют в интеграцию AI в свои продукты.

Нейросети — мощный инструмент для создания современных игр. С их помощью можно реализовать инновационные игровые механики и значительно повысить качество контента.

Источник

Новости

Этические вопросы применения искусственного интеллекта: Опасности, риски и способы противодействия

admin 15.06.2025

admin

Рассмотрим этические вопросы, связанные с применением искусственного интеллекта. Опасности и риски, которые несет развитие технологий ИИ, а также способы борьбы с ними, подробный анализ и обсуждение.

Искусственный интеллект (ИИ) становится все более распространенным в различных областях нашей жизни, но вместе с его развитием возникают и этические вопросы. Несмотря на объективные преимущества, ИИ также несет опасности и риски, которые должны быть тщательно изучены и учтены.

Опасности, риски и способы противодействия

Применение искусственного интеллекта может привести к серьезным этическим проблемам. Вот некоторые из них:

1. Приватность данных: Сбор и использование больших объемов данных с помощью ИИ могут подвергать вопросу право на приватность и безопасность персональных данных. Несанкционированный доступ к таким данным или их неправильное использование может создать угрозу для личной жизни и свободы людей.

2. Автономные системы: Развитие автономных систем с использованием ИИ, таких как автономные транспортные средства или роботы, вызывает опасения относительно безопасности и контроля. Возможность принятия автономных решений ИИ может иметь непредсказуемые и нежелательные последствия.

3. Создание и распространение дезинформации: ИИ может быть использован для создания и распространения дезинформации и фейковых новостей. Это может привести к распространению ложной информации, манипуляции общественным мнением и угрозе демократическим принципам.

Риски развития технологий ИИ

С развитием технологий ИИ связаны следующие риски:

1. Уязвимость для взломов и кибератак: ИИ-системы могут быть подвержены взлому или кибератакам, что создает опасность для конфиденциальности и безопасности данных. Нарушение целостности и подделка данных может иметь серьезные последствия.

2. Непредсказуемость решений: ИИ-системы могут принимать решения, которые сложно объяснить или предсказать. Это может создавать проблемы, особенно в областях, где принимаемые решения имеют большое значение, например, в медицине или правоохранительной деятельности.

Борьба с этическими проблемами ИИ

Для борьбы с этическими проблемами ИИ необходимы глобальные и международные усилия. Вот несколько способов противодействия рискам и опасностям, связанным с применением искусственного интеллекта:

1. Разработка надлежащих правовых и этических рамок: Регулирование использования ИИ и установление четких правил и ограничений поможет защитить от возможных злоупотреблений и нарушений этических норм.

2. Создание открытых и прозрачных систем: Важно разрабатывать ИИ-системы, которые являются прозрачными и понятными для пользователя. Это поможет установить доверие и избежать нежелательных последствий использования ИИ.

3. Развитие государственных и корпоративных политик безопасности: Необходимо создать строгие политики безопасности, которые помогут защитить данные, предотвратить взломы и минимизировать риски для общества.

Заключение

Быстрое развитие искусственного интеллекта предоставляет огромные возможности, но и несет в себе этические проблемы и риски. Чтобы эффективно использовать ИИ, необходимо учитывать эти факторы и разрабатывать соответствующие стратегии и меры по их преодолению.

Источник

Новости

Действительно ли модели рассуждений «думают» или нет? Apple Research Sparks Lively Debates, ответ

admin 14.06.2025

admin

В начале этого месяца группа Apple в области машинного обучения вызвала риторический огненный шторм с ее выпуском «Иллюзии мышления», 53-страничного исследовательского документа, в котором утверждается, что так называемые большие модели рассуждений (LRM) или рассуждение крупных языковых моделей (рассуждение LLM), такие как «O Openai» и «O» и Google Gemini-2.5 Pro, и флэш-мышления на самом деле не участвуют в «Независимых» или «Принципах», из которых «мыслит» или «Основные данные», из которых «мыслит» или «Основные данные», из которых «мыслит» или «Принципы, основанные на том, что они знают» из «Основных» или «Обучающихся».

Instead, the authors contend, these reasoning LLMs are actually performing a kind of “pattern matching” and their apparent reasoning ability seems to fall apart once a task becomes too complex, suggesting that their architecture and performance is not a viable path to improving generative AI to the point that it is artificial generalized intelligence (AGI), which OpenAI defines as a model that outperforms humans at most economically valuable work, or superintelligence, AI even умнее, чем люди могут понять.

ACT Now: Приходите обсудить последние достижения LLM и исследования в VB Transform 24-25 июня в SF-ограниченные билеты доступныПолем Зарегистрироваться сейчас

Неудивительно, что статья немедленно широко распространена среди сообщества машинного обучения на X, и начальные реакции многих читателей состояли в том, чтобы заявить, что Apple эффективно опровергает большую часть ажиотажа вокруг этого класса AI: «Apple только что доказало, что модели« рассуждения », такие как Claude, Deepseek-R1 и O3-Mini, на самом деле не приводятся в пост, на самом деле не приводятся в Decen-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben-ruben. «Они просто запоминают закономерности очень хорошо».

Но сегодня появилась новая статья, нахальная название «Иллюзия иллюзии мышления», что важно, в соавторстве с учетом самого рассуждения LLM, Claude Opus 4 и Alex Lawsen, человеческого и независимого исследователя ИИ и технического писателя, которые включают в себя в основе «Армия», в том числе ими, что инициализируют, что инициализируют, что инициализирующие работы в области Applemally. ошибочно.

Хотя мы здесь, в VentureBeat, сами не сами не готовы сказать, что исследователи Apple ошибаются, дебаты, безусловно, были оживленной, и проблема о возможностях LRMS или Doideor LLM по сравнению с человеческим мышлением кажется далеко не решенным.

Как было разработано исследование Apple — и что он нашел

Используя четыре классические проблемы с планированием — Tower of Hanoi, Blocks World, River Crossing and Checkers Jumping — исследователи Apple разработали батарею задач, которые заставляли модели рассуждений планировать несколько ходов вперед и генерировать полные решения.

Эти игры были выбраны для их долгой истории в когнитивной науке и исследованиях искусственного интеллекта и их способности масштабироваться в сложности, поскольку добавляются больше шагов или ограничений. Каждая головоломка требовала, чтобы модели не просто давали правильный окончательный ответ, но и объясняли свое мышление на этом пути, используя подсказку цепочки мыслей.

По мере того, как головоломки увеличились в сложности, исследователи наблюдали постоянное падение точности в нескольких ведущих моделях рассуждений. В самых сложных задачах производительность упала до нуля. Примечательно, что длина внутренних рассуждений моделей, измеряемых количеством жетонов, потраченных на размышление через проблему, также начали сокращаться. Исследователи Apple интерпретировали это как признак того, что модели полностью отказались от решения проблем, как только задачи стали слишком сложными, по сути, «сдаваясь».

Сроки выпуска газеты, опередив ежегодной мировой конференции разработчиков Apple (WWDC), добавило к воздействию. Он быстро стал вирусным по всему X, где многие интерпретировали результаты как громкое признание того, что LLM-генерации текущего поколения все еще являются прославленными автоматическими двигателями, а не мыслителями общего назначения. Это кадрирование, хотя и спорно, привело к большей части первоначальной дискуссии и последовавших дебатов.

Критики направлены на x

Среди наиболее вокальных критиков статьи Apple были ML -исследователь и x пользователь @scailing01 (он же «Лисан Аль Гайб»), который разместил несколько потоков, рассекающих методологию.

В одном широко распространенном посте Лизан утверждал, что команда Apple объединила сбои бюджета токенов с ошибками рассуждений, отметив, что «все модели будут иметь 0 точность с более чем 13 дисками просто потому, что они не могут так много выводить!»

Для таких головоломок, как Tower of Hanoi, подчеркнул, что размер выхода растет в геометрической прогрессии, в то время как окна контекста LLM остаются фиксированными, написание «Только потому, что башня Ханоя требует больше шагов, чем другие, что требует только квадратично или линейно, больше шагов, не означает, что башня Hanoi более сложный», и убедительно, что модели, такие модели 3, что-то вроде 3-й сон. или код — но все еще были помечены неправильными.

В другом посте подчеркнулось, что даже разбивая задачу на более мелкие, разлагаемые шаги, ухудшал производительность модели — не потому, что модели не понимали, а потому, что им не хватало памяти о предыдущих шагах и стратегии.

«LLM нуждается в истории и великой стратегии»,-написал он, предполагая, что реальная проблема-размер контекста, а не рассуждения.

Я поднял еще одно важное зерно соли на X: Apple никогда не сравнивала модель производительности против человеческой производительности в одних и тех же задачах. «Я скучаю по нему, или вы не сравнивали LRM с человеческой перфу (Ormance) на (те же задачи? Я спросил исследователей непосредственно в потоке, пометившей авторов газеты. Я также написал им по электронной почте об этом и многих других вопросах, но им еще предстоит ответить.

Другие повторили это мнение, отметив, что решающие проблемы человеческих проблем также колеблется на длинных многоэтапных логических головоломках, особенно без инструментов для ручки и бумаги или средств памяти. Без этого базового уровня утверждение Apple о фундаментальном «рассуждении» кажется неземным.

Несколько исследователей также подвергли сомнению бинарное кадрирование названия и диссертации газеты — определяя жесткую линию между «сопоставлением с образцом» и «рассуждением».

Александр Дория, также известная как Пьер-Карл Ланглайс, тренер LLM в энергоэффективном французском AI Startup Pleias, сказал, что кадрирование скучает по нюансуутверждая, что модели могут изучать частичную эвристику, а не просто соответствовать шаблонам.

Хорошо, я думаю, мне нужно пройти через эту яблочную бумагу.

Моя основная проблема — это кадрирование, которое является супер двоичным: «Способны ли эти модели к обобщаемым рассуждениям, или они используют различные формы сопоставления рисунков?» Или что, если они поймали только подлинную, но частичную эвристику. pic.twitter.com/gze3eg7wlm
— Александр Дория (@dorialexander) 8 июня 2025 года

Этан Моллик, специалист по искусственному искусству в Университете Университета Университета Пенсильвании в Уортонской школе Уортон, назвал идею о том, что LLM «ударяют в стену», сравнивая его с аналогичными утверждениями о «коллапсе моделей», который не вышел.

Между тем, такие критики, как @ArithMoquine, были более циничными, предполагая, что Apple — набирает кривую на LLMS по сравнению с такими соперниками, как Openai и Google, пытаются снизить ожидания », придумывая исследование« как все это подделка и гей и не имеет значения », — они свернули, указывая на репутацию Apple с той плохой исполнением продуктов AI, такими как SIRI.

Короче говоря, в то время как исследование Apple вызвало содержательный разговор о строгости оценки, оно также обнаружило глубокий разрыв из -за того, сколько доверия к показателям в метрик, когда сам тест может быть ошибочным.

Артефакт измерения или потолок?

Другими словами, модели, возможно, поняли головоломки, но закончились «бумагой», чтобы написать полное решение.

«Пределы токенов, а не логика, заморозили модели»,-написал исследователь Карнеги Меллона Рохан Пол в широко распространенной теме, обобщающей последующие тесты.

Тем не менее, не все готовы очистить LRM об заряде. Некоторые наблюдатели отмечают, что исследование Apple по-прежнему выявило три режима производительности-простые задачи, в которых болит дополнительные рассуждения, головоломки среднего уровня, где оно помогает, и случаи высокого раскола, где как стандартный, так и «мыслительный» кратер.

Другие рассматривают дискуссию как корпоративное позиционирование, отмечая, что собственные модели Apple в «Apple Intelligence» следуют соперникам на многих общедоступных лидерах.

Опровержение: «Иллюзия иллюзии мышления»

В ответ на претензии Apple, была выпущена новая статья под названием «Иллюзия иллюзии мышления», была выпущена на Arxiv независимым исследователем и техническим писателем Алексом Алексом Лоусеном некоммерческой открытой благотворительности в сотрудничестве с Claude Opus 4 в Антрии.

В документе непосредственно бросается вызов исходному исследованию, что LLMS терпят неудачу из -за неотъемлемой неспособности рассуждать в масштабе. Вместо этого, опровержение представляет доказательства того, что наблюдаемый коллапс производительности был в значительной степени побочным продуктом тестовой установки, а не истинным пределом рассуждений.

Законы и Клод демонстрируют, что многие из неудач в исследовании Apple связаны с ограничениями токена. Например, в таких задачах, как Башня Ханои, модели должны печатать в геометрической прогрессии, многие шаги — более 32 000 ходов всего за 15 дисков — что приводит их к ударам выходных потолков.

Опровержение указывает, что сценарий оценки Apple наказал эти токеновые выходные выходы как неверные, даже когда модели следовали правильной стратегии решения внутренне.

Авторы также выделяют несколько сомнительных конструкций задач в яблочных тестах. Они отмечают, что некоторые из загадок пересечения реки математически неразрешимы, и все же модельные результаты для этих случаев все еще были оценены. Это также ставит под сомнение вывод о том, что неудачи точности представляют когнитивные ограничения, а не структурные недостатки в экспериментах.

Чтобы проверить свою теорию, Lawsen и Claude провели новые эксперименты, позволяя моделям давать сжатые программные ответы. Когда его попросили вывести функцию LUA, которая могла бы генерировать решение башни Ханоя-развлечь, чем писать каждую ступенчатую линию,-модели внезапно преуспели в гораздо более сложных проблемах. Этот сдвиг в формате полностью исключил коллапс, предполагая, что модели не перестали рассуждать. Они просто не смогли соответствовать искусственной и чрезмерно строгой рубрике.

Почему это важно для лиц, принимающих решения предприятия

В задней части и до начала растущий консенсус: дизайн оценки теперь так же важен, как и дизайн модели.

Требование LRM для перечисления каждого шага может проверять их принтеры больше, чем их планировщики, в то время как сжатые форматы, программные ответы или внешние наборы для царапин дают чистоту чтения на фактической способности рассуждения.

Эпизод также подчеркивает практические ограничения, с которыми сталкиваются разработчики, когда они отправляют агентские системы-контактные окна, выходные бюджеты и составление задач могут сделать или нарушать производительность пользователя.

Для предприятия, принимающих технические решения, строящие заявки на рассуждения LLMS, эта дискуссия более чем академическая. Это поднимает критические вопросы о том, где, когда и как доверять этим моделям в производственных рабочих процессах, особенно когда задачи включают длительные цепочки планирования или требуют точного пошагового вывода.

Если модель, по -видимому, «не удается» в сложной подсказке, проблема может не лежать в его способности рассуждать, но в том, как задача обрамлена, сколько выводов требуется или сколько памяти имеет доступ к модели. Это особенно актуально для промышленности, создающих инструменты, такие как коллеги, автономные агенты или системы поддержки решений, где как интерпретируемость, так и сложность задач могут быть высокими.

Понимание ограничений контекстных окон, бюджетов токенов и рубриков, используемых в оценке, имеет важное значение для надежного проектирования системы. Разработчикам может потребоваться рассмотреть гибридные решения, которые внешние памяти, шаги рассуждения куски или используют сжатые выходы, такие как функции или код вместо полных словесных объяснений.

Самое главное, что противоречие статьи является напоминанием о том, что сравнительный анализ и применение реального мира не одинаковы. Команды предприятия должны быть осторожны с чрезмерным поправкой на синтетические критерии, которые не отражают практические варианты использования, или это непреднамеренно ограничивает способность модели демонстрировать то, что она знает.

В конечном счете, большой вывод для исследователей ML заключается в том, что перед провозглашением вехи ИИ — или некролога — убедится, что сам тест не ставит систему в коробку слишком маленькой, чтобы думать внутри.

Источник

Новости

Почему ChatGPT пока не разумен, а будущие ИИ могут стать сознательными

admin 14.06.2025

admin

Последнее время все чаще слышны разговоры о том, что искусственный интеллект может обрести сознание. Но что для этого действительно нужно? В прошлом году инженер Google, Блейк Лемуан, заявил, что чат-бот компании LaMDA обрел способность осознавать окружающий мир.

Почему ChatGPT пока не разумен, а будущие ИИ могут стать сознательными

По словам Лемуана, программа обладала разговорными способностями семилетнего ребенка, и мы должны были предположить, что она обладает аналогичной осведомленностью о мире.

LaMDA, позже ставшая общедоступной под названием Bard, работает на основе «большой языковой модели» (LLM), подобной той, что лежит в основе бота ChatGPT компании OpenAI. Другие крупные технологические компании спешат внедрить аналогичную технологию.

Сотни миллионов людей уже получили возможность поиграть с LLM, но мало кто верит в то, что они обладают сознанием. Вместо этого, по поэтическому выражению лингвиста и специалиста по изучению данных Эмили Бендер, они представляют собой «стохастических попугаев», которые убедительно болтают, ничего не понимая. Но как быть со следующим поколением систем искусственного интеллекта (ИИ) и последующими?

Наша группа философов, нейробиологов и компьютерщиков, опираясь на современные научные теории работы человеческого сознания, составила список основных вычислительных свойств, которыми, вероятно, должна обладать гипотетически сознательная система. По нашему мнению, ни одна из современных систем не приближается к планке сознания, но в то же время нет никаких очевидных причин, по которым будущие системы не смогут стать по-настоящему сознательными.

Поиск индикаторов

С тех пор как в 1950 г. пионер вычислительной техники Алан Тьюринг предложил свою «Игру в имитацию», способность успешно выдавать себя за человека в разговоре часто принималась за надежный маркер сознания. Обычно это объясняется тем, что задача казалась настолько сложной, что для ее решения необходимо сознание.

Однако, как и в случае с победой шахматного компьютера Deep Blue над гроссмейстером Гари Каспаровым в 1997 году, разговорная беглость LLM может просто сдвинуть точку отсчета. Существует ли принципиальный способ подойти к вопросу о сознании ИИ, который не опирался бы на наши интуитивные представления о том, что является сложным или особенным в человеческом познании?

Именно на это направлена наша недавняя статья. Мы сравнили существующие научные теории о том, что делает человека сознательным, и составили список «индикаторных свойств», которые затем можно применить к системам ИИ.

Мы не считаем, что системы, обладающие индикаторными свойствами, обязательно обладают сознанием, но чем больше индикаторов, тем серьезнее мы должны относиться к заявлениям о сознании ИИ.

Источник

Новости

Обновления Bard от Google: что нового в чат-боте и стоит ли им пользоваться

admin 14.06.2025

admin

Недавно Google выпустила очередное обновлений для своего чат-бота Bard. Новые функции включают расширения, которые интегрируют Bard с другими сервисами Google, такими как Gmail, Docs и YouTube. Компания продолжает экспериментировать с искусственным интеллектом как частью следующей волны информационного поиска.

Обновления Bard от Google: что нового в чат-боте и стоит ли им пользоваться

Хотя первоначальный обзор расширений Bard не впечатляют, тем, у кого много непрочитанных писем в почтовом ящике Gmail или много старых документов в Google Docs, обновление может показаться довольно интересным.

Перед взаимодействием с любым чат-ботом стоит позаботиться о конфиденциальности.

Если вы решите использовать расширения Workspace, ваш контент из Gmail, Docs и Drive не будет виден модераторам, не будет использован Bard для показа рекламы или для обучения модели Bard

— сообщает Google.

Хватит ли вам таких заверений? Вот как включить обновления для Bard и несколько советов, на что следует обратить внимание.

Как применять расширение Google Bard

Чтобы взаимодействовать с Bard, вам нужно создать учетную запись Google, если у вас ее еще нет. Как только вы войдете в систему, доступ к Bard так же прост, как посещение веб-сайта в браузере.

На главной странице Bard вы можете активировать подключения к Google Flights, Google Hotels, Google Maps, YouTube и Google Workspace, куда входят Gmail, Google Docs и Google Drive. Каждое из этих расширений можно включать и отключать по отдельности.

Если вы решите активировать расширение Workspace, обязательно добавляйте теги к тому, на чем хотите, чтобы чат-бот сосредоточился, например @docs, @drive или @gmail. Вот пример запроса:

Пожалуйста, проверь мой @gmail и резюмируй непрочитанные письма за сегодня.

Советы по поиску в Gmail и Google Docs

Крайне важно не завышать ожиданий от нововведений для Bard. Многие функции ИИ, выпущенные в 2023 году, были признаны как экспериментальные, и обновление Bard не исключение. Оно нацелено в первую очередь на наиболее свежие письма электронной почты в вашем Gmail. Отвечая запросам, Bard часто ссылался на 5 связанных сообщений. Но когда его попросили назвать самое старое сообщение в почтовом ящике от конкретного отправителя, чат-бот привел письмо с прошлой недели и ошибся всего на пару лет!

Хотя ответы чат-ботов всегда следует перепроверять, но Bard очень часто выдумывал и неправильно понимал контекст информации из писем и других документов. Например, когда его спросили, «есть ли сообщения от моего отца», Bard выдал случайную рекламу ко Дню отца, которая пылилась в почтовом ящике с 2017 года, и пояснил что это единственное сообщение от него.

Чем могут быть полезны, несовершенные расширения Bard?

Если вы ищете письмо или документ, который помните примерно по теме, но не деталям, это отличное применение нового Bard. Чат-бот может найти информацию по разным темам — от видеоигр до бассейнов для плавания.

Еще одно интересное применение нового расширения — возможность дать обратную связь по вашим запросам. Когда его попросили выделить письма, которые можно было написать лучше, Bard нашел в почтовом ящике три таких и дал неплохие советы по корректировке тона и сделать их более лаконичными.

Однако чат-бот плохо справляется с нюансами. Когда его спросили, есть ли в почтовом ящике письма с «микроагрессией», ответ Bard был почти комичным. Он выбрал информационную рассылку Брэндона Тейлора, в которой тот назвал телесериал “Золотой век” “сентиментальной периодической драмой”. Bard решил, что “это можно рассматривать как микроагрессию против любителей периодических драм, так как подразумевается, что такие шоу несерьезные и не стоят внимания”. Хотя формально верно, но вряд ли большинство людей назвали бы это микроагрессией.

Несмотря на завышенные ожидания, Bard предстоит еще многое сделать, прежде чем он станет надежным помощником. Пока же классическая строка поиска в верхней части папки «Входящие» остается самым простым способом найти то, что нужно и что это не будет выдумано искусственным интеллектом.

Источник

Новости

Помимо архитектуры GPT: почему подход к распространению Google может изменить развертывание LLM

admin 14.06.2025

admin

В прошлом месяце, наряду с комплексным набором новых инструментов и инноваций AI, Google DeepMind представила диффузию Близнецов. В этой экспериментальной модели исследования используется подход на основе диффузии для создания текста. Традиционно, крупные языковые модели (LLMS), такие как GPT и сами Близнецы, полагались на авторегрессию, пошаговый подход, в котором каждое слово генерируется на основе предыдущего. Модели диффузионного языка (DLMS), также известные как крупные языковые модели на основе диффузии (DLLM), используют метод, чаще встречающийся в генерации изображений, начиная со случайного шума и постепенно переработав его в когерентный выход. Этот подход значительно увеличивает скорость генерации и может улучшить когерентность и последовательность.

Диффузия Близнецов в настоящее время доступна в качестве экспериментальной демонстрации; Подпишитесь на список ожидания, чтобы получить доступПолем

(Примечание редактора: мы распаковываем смены парадигмы, такие как языковые модели на основе диффузии-и что нужно для их запуска в производстве-в VB Transform, 24–25 июня в Сан -Францисконаряду с Google DeepMind, LinkedIn и другими руководителями ИИ предприятия.)

Понимание диффузии против авторегрессии

Диффузия и авторегрессия являются принципиально разными подходами. Ауторегрессивный подход генерирует текст последовательно, с токенами предсказаны по одному. Хотя этот метод обеспечивает сильную когерентность и отслеживание контекста, он может быть вычислительно интенсивным и медленным, особенно для длительного содержания.

Диффузионные модели, напротив, начинаются со случайного шума, который постепенно превращается в когерентный выход. При применении к языку техника имеет несколько преимуществ. Блоки текста могут быть обработаны параллельно, потенциально производящие целые сегменты или предложения с гораздо более высокой скоростью.

По сообщениям, диффузия Близнецов может генерировать 1000-2000 токенов в секунду. Напротив, Flash Gemini 2,5 имеет среднюю скорость выходной мощности 272,4 токена в секунду. Кроме того, ошибки в генерации могут быть исправлены во время процесса переработки, повышение точности и снижение количества галлюцинаций. Там могут быть компромиссы с точки зрения мелкозернистой точности и контроля на уровне токена; Тем не менее, увеличение скорости будет изменять игру для многочисленных приложений.

Как работает генерация текста на основе диффузии?

Во время обучения DLMS работает, постепенно развращая предложение с шумом на многих шагах, пока первоначальное предложение не станет совершенно неузнаваемым. Затем модель обучается обратить вспять этот процесс, шаг за шагом, реконструируя исходное предложение от все более шумных версий. Благодаря итеративному уточнению он учится моделировать все распределение правдоподобных предложений в учебных данных.

Хотя специфика диффузии Близнецов еще не раскрыта, типичная методология обучения для диффузионной модели включает в себя эти ключевые этапы:

Вперед диффузия: При каждом образе в тренировочном наборе данных шум постепенно добавляется в течение нескольких циклов (часто от 500 до 1000), пока он не станет неразличимым от случайного шума.

Обратная диффузия: Модель учится обратить каждый шаг из процесса заработной платы, по сути, изучая, как «денузировать» поврежденное предложение по одному этапу за раз, в конечном итоге восстанавливая исходную структуру.

Этот процесс повторяется миллионы раз с разнообразными образцами и уровнями шума, что позволяет модели изучить надежную функцию двойного обзора.

После обучения модель способна генерировать совершенно новые предложения. DLMS, как правило, требует условия или ввода, такого как подсказка, метка класса или встраивание, чтобы направлять поколение к желаемым результатам. Условие вводится в каждый этап процесса двойного раздела, который формирует начальную каплю шума в структурированный и когерентный текст.

Преимущества и недостатки моделей на основе диффузии

В интервью VentureBeat Брендан О’Донохью, научный сотрудник Google DeepMind и один из главных по сравнению с диффузионным проектом Близнецов, подробно рассказал о некоторых преимуществах методов на основе диффузии по сравнению с авторегрессией. Согласно О’Донохью, основные преимущества диффузионных методов являются следующими:

Нижние задержки: Диффузионные модели могут создавать последовательность токенов за гораздо меньше времени, чем авторегрессивные модели.
Адаптивные вычисления: Диффузионные модели будут сходиться к последовательности токенов с разными скоростями в зависимости от сложности задачи. Это позволяет модели потреблять меньше ресурсов (и иметь более низкие задержки) для простых задач и больше на более сложных.
Неуазуральные рассуждения: Из -за двунаправленного внимания в Denoiser токены могут заниматься будущими токенами в том же поколении. Это позволяет иметь нецелостные рассуждения и позволяет модели вносить глобальные изменения в блоке для создания более когерентного текста.
Итеративная уточнение / самокоррекция: Процесс унижения включает выборку, которая может вводить ошибки, как в авторегрессии моделей. Однако, в отличие от авторегрессивных моделей, токены передаются обратно в денозер, который затем имеет возможность исправить ошибку.

O’Donoghue также отметил основные недостатки: «Более высокая стоимость обслуживания и немного более высокое время к первым (TTFT), поскольку авторегрессивные модели будут создавать первый токен сразу. Для диффузии первый жетон может появиться только тогда, когда вся последовательность токенов будет готова».

Производительность

Google говорит, что производительность диффузии Gemini сопоставима с Flash-Lite Gemini 2.0.

Эталон	Тип	Диффузия Близнецов	Gemini 2.0 Flash-Lite
LiveCodebench (V6)	Код	30,9%	28,5%
BigCodebench	Код	45,4%	45,8%
LBPP (V2)	Код	56,8%	56,0%
Swe-Bench проверил*	Код	22,9%	28,5%
Гуманевал	Код	89,6%	90,2%
MBPP	Код	76,0%	75,8%
GPQA Diamond	Наука	40,4%	56,5%
AIME 2025	Математика	23,3%	20,0%
Большой палочку очень тяжело	Рассуждение	15,0%	21,0%
Глобальный MMLU (Lite)	Многоязычный	69,1%	79,0%

* Неагентическая оценка (только для редактирования одного поворота), максимальная длина подсказки 32 тыс..

Эти две модели сравнивались с использованием нескольких критериев, с оценками, основанными на том, сколько раз модель давала правильный ответ с первой попытки. Диффузия Близнецов хорошо выполнялась в тестах кодирования и математики, в то время как Flash-Lite Gemini 2.0 имел преимущество в рассуждениях, научных знаниях и многоязычных возможностях.

По мере развития диффузии Близнецов нет никаких оснований думать, что его производительность не догоняет с более устоявшимися моделями. По словам О’Донохью, разрыв между двумя методами «по существу закрыт с точки зрения контрольной производительности, по крайней мере, в относительно небольших размерах, которые мы масштабировали.

Тестирование диффузии Близнецов

VentureBeat получил доступ к экспериментальной демонстрации. Когда мы переживая диффузию Близнецов через свои шаги, первое, что мы заметили, было скоростью. При запуске предлагаемых подсказок, предоставленных Google, включая создание интерактивных приложений HTML, таких как ксилофон и планета Tac Toe, каждый запрос выполняется менее чем за три секунды, со скоростью от 600 до 1300 токенов в секунду.

Чтобы проверить его производительность с помощью реального приложения, мы попросили диффузию Gemini для создания интерфейса видеочата со следующей подсказкой:

Build an interface for a video chat application. It should have a preview window that accesses the camera on my device and displays its output. The interface should also have a sound level meter that measures the output from the device's microphone in real time.

Менее чем за две секунды диффузия Близнецов создала рабочий интерфейс с предварительным просмотром видео и аудиометра.

Хотя это не было сложной реализацией, это могло бы быть началом MVP, который может быть завершен с небольшим количеством дальнейшего подсказки. Обратите внимание, что Flash Gemini 2.5 также создала рабочий интерфейс, хотя и в немного более медленном темпе (приблизительно семь секунд).

Диффузия Близнецов также включает в себя «Мгновенное редактирование», режим, в котором текст или код могут быть вставлены и отредактированы в режиме реального времени с минимальным подсказом. Мгновенное редактирование эффективно для многих типов текстового редактирования, включая исправление грамматики, обновление текста для нацеливания на различные персонажи читателей или добавление ключевых слов SEO. Он также полезен для таких задач, как код Refactoring, добавление новых функций в приложения или преобразование существующей кодовой базы на другой язык.

Примеры использования предприятия для DLMS

Можно с уверенностью сказать, что любое приложение, которое требует быстрого отклика, может получить выгоду от технологии DLM. Это включает в себя приложения в режиме реального времени и с низкой задержкой, такие как разговорные ИИ и чат-боты, живая транскрипция и перевод, или ассистенты по автозаполнению IDE и кодирование.

По словам О’Донохью, с приложениями, которые используют «встроенное редактирование, например, привлечение куска текста и внесение некоторых изменений на месте, диффузионные модели применимы так, как это не так». DLMS также имеет преимущество с проблемами разума, математики и кодирования, из-за «бессмысленных рассуждений, предоставляемых двунаправленным вниманием».

DLM все еще в зачаточном состоянии; Тем не менее, технология может потенциально изменить то, как создаются языковые модели. Они не только генерируют текст с гораздо более высокой скоростью, чем авторегрессивные модели, но и способность возвращаться и исправлять ошибки означает, что, в конечном итоге, они также могут дать результаты с большей точностью.

Диффузия Близнецов входит в растущую экосистему DLMS, с двумя заметными примерами, которые являются ртутью, разработанные Labs, и LLADA, модель с открытым исходным кодом от GSAI. Вместе эти модели отражают более широкий импульс, лежащий в основе генерации языка на основе диффузии и предлагают масштабируемую, параллелизируемую альтернативу традиционным ауторегрессионным архитектурам.

Источник