Категория:

ИИ в искусстве

Google DeepMind разрывает новую почву с «mirasol3b» для расширенного анализа видео

admin 15.06.2025

admin

Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

Google Deepmind тихо показал значительный прогресс в своих исследованиях искусственного интеллекта (ИИ) во вторник, представляя новую авторегрессивную модель, направленную на улучшение понимания длинных видео входов.

Новая модель под названием «Mirasol3b» демонстрирует революционный подход к мультимодальному обучению, обработке аудио, видео и текстовых данных более интегрированно и эффективно.

По словам Исаака Нобла, инженера-программиста в Google Research и Anelia Angelova, исследователя Google DeepMind, который написал в соавторстве с длинным сообщением в блоге об их исследованиях, задача создания мультимодальных моделей заключается в неоднорозности модальностей.

«Некоторые модальности могут быть хорошо синхронизированы во времени (например, аудио, видео), но не выровнены с текстом», — объясняют они. «Кроме того, большой объем данных в видео и аудиосигналах намного больше, чем в тексте, поэтому при их объединении в мультимодальных моделях видео и аудио часто не могут быть полностью потреблены и должны быть непропорционально сжаты. Эта проблема усугубляется для более длинных видео входов».

Новый подход к мультимодальному обучению

В ответ на эту сложность, модель Google Mirasol3B Декулирует мультимодальное моделирование в отдельных целенаправленных авторегрессивных моделях, обрабатывая входы в соответствии с характеристиками методов.

«Наша модель состоит из авторегрессивного компонента для синхронизированных по времени методов (аудио и видео) и отдельного авторегрессивного компонента для методов, которые не обязательно выравниваются по времени, но все еще являются последовательными, например, текстовые входы, такие как заголовок или описание»,-объясняют NOBLE и Angelova.

Объявление происходит в то время, когда технологическая индустрия стремится использовать силу ИИ для анализа и понимания огромных объемов данных в разных форматах. Google Mirasol3b представляет собой значительный шаг вперед в этом усилия, открывая новые возможности для таких приложений, как ответ на видео -вопросы и обеспечение длительного качества видео.

Потенциальные приложения для YouTube

Одним из возможных приложений модели, которые может изучить Google, является использование ее на YouTube, которая является крупнейшей в мире онлайн -видео платформой и одним из основных источников доходов компании.

Теоретически модель может использоваться для улучшения пользовательского опыта и взаимодействия путем предоставления более мультимодальных функций и функций, таких как генерирование подписей и резюме для видео, ответа на вопросы и предоставление обратной связи, создание персонализированных рекомендаций и рекламных объявлений, а также позволяют пользователям создавать и редактировать свои собственные видео с использованием многомодальных входов и результатов.

Например, модель может генерировать подписи и резюме для видео, основанных как на визуальном, так и аудиоконтенте, и позволить пользователям поиск и фильтровать видео по ключевым словам, темам или чувствам. Это может улучшить доступность и открытие видео и помочь пользователям найти контент, который они ищут легче и быстро.

Модель может также теоретически использоваться для ответа на вопросы и предоставления обратной связи для пользователей на основе видеоконтента, например, объяснение значения термина, предоставление дополнительной информации или ресурсов или предложение связанных видео или списков воспроизведения.

Смешанная реакция сообщества ИИ

Объявление вызвало большой интерес и волнение в сообществе искусственного интеллекта, а также скептицизм и критику. Некоторые эксперты высоко оценили модель за ее универсальность и масштабируемость и выразили свои надежды на его потенциальные приложения в различных областях.

Например, Лео Троншон, инженер -исследователь ML в обнимании лица, твитнул: «Очень интересно видеть, как такие модели, как Mirasol, включают в себя больше модальностей. На открытии еще не так много сильных моделей, использующих как аудио, так и видео. Было бы действительно полезно иметь его (обнимаю лицо)».

Гаутам Шарда, студент компьютерных наук в Университете Айовы, твитнул: «Похоже, нет никакого кода, веса модели, данных обучения или даже API. Почему бы и нет? Я бы хотел, чтобы они фактически выпустили что -то за пределами только исследовательскую статью?».

Значительная веха для будущего ИИ

Объявление знаменует собой значительную веху в области искусственного интеллекта и машинного обучения, а также демонстрирует амбиции и лидерство Google в разработке передовых технологий, которые могут улучшить и преобразовать человеческие жизни.

Тем не менее, это также создает проблему и возможности для исследователей, разработчиков, регуляторов и пользователей ИИ, которые должны обеспечить, чтобы модель и ее приложения были согласованы с этическими, социальными и экологическими ценностями и стандартами общества.

Поскольку мир становится более мультимодальным и взаимосвязанным, важно способствовать культуре сотрудничества, инноваций и ответственности среди заинтересованных сторон и общественности, а также создать более инклюзивную и разнообразную экосистему ИИ, которая может принести пользу всем.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Tenyx стремится решить проблему катастрофического забывания LLMS LLMS

admin 15.06.2025

admin

Чтобы получить максимальную отдачу от больших языковых моделей (LLMS), предприятия должны настраивать их, настраивая их с использованием данных, специфичных для домена. Это помогает полировать модель так, чтобы она генерировала соответствующие выходы.

Тем не менее, предварительно обученные модели с тонкой настройкой создают значительную, потенциально опасную проблему: оттачивание моделей на различных распределениях, чем их оригинальные наборы данных, переориентирующие свои веса в новые входные данные.

В дальнейшем модель в конечном итоге использует информацию, которую она запомнила во время обучения — так называемое «катастрофическое забывание». Это ухудшает навыки знаний и рассуждения LLMS, а также его производительность и удобство использования.

Компания Voice AI Ag Agent Tenyx сегодня объявляет о методе точной настройки, чтобы помочь решить эту явную проблему. Платформа помогает предприятиям адаптировать LLMS к своим уникальным требованиям без ущерба для основополагающих знаний или защитных гарантий.

«Катастрофическое забывание было давним вызовом в сообществе машинного обучения», — сказал VentureBeat в эксклюзивном интервью Итамар Арел, генеральный директор и основатель Tenyx. «В течение многих лет предполагалось, что всегда можно продолжать обучаться новым данным, включая старые».

Потеря критических возможностей, воздействие вредного и предвзятого контента

По словам Арела, тонкая настройка набирает обороты в качестве важнейшего инструмента в «арсенале методов, направленных на использование LLM» для применений предприятия.

Тем не менее, ученые-ученые с той настройкой LLM с помощью стандартных методов, как правило, не имеют доступа к полному набору данных, на которые была обучена модель, и обычные схемы не рассматривают риски забывающих эффектов. Это приводит к потере критических возможностей, а также к потенциальному воздействию вредных комментариев (которые могут представлять юридическую ответственность).

Например, сказал Арел, Llama 7B может использоваться в качестве двигателя для чат -бота обслуживания клиентов, такого как агент по бронированию отелей. Но так как он готов и не оптимизирован для этого конкретного домена, ученые-данные должны точно настроить его на основе, скажем, на наборе типичных разговоров между человеческими агентами и клиентами, стремящимися забронировать номер в отеле. Это, вероятно, будет использовать обычные методы точной настройки, такие как адаптация с низким уровнем ранга (LORA).

Очень быстро, как знания (например, ответы на «Какое расстояние от отеля до аэропорта?»), Так и возможности рассуждений (правильно вывод, такие как «Я приеду 7 декабря на четыре ночи», например,) могут быть потеряны.

«Полученная тонкая модель может лучше реагировать на конкретные входные данные, но может внезапно произвести неправильные или потенциально предвзятые ответы относительно общих знаний и рассуждений»,-сказал Арел.

В другом сценарии LLM обучается с корпусом английских предложений, что делает его способным рассуждать и отвечать на вопросы общих знаний. Позднее тонкая настройка на наборах данных по структурно и синтаксически различным языкам кодирования изменит то, как модель захватывает информацию, преобразует ее и выводит новую информацию.

«Такое изменение приведет к тому, что сеть потеряет свои способности в создании 100% последовательных заявлений на английский язык», — сказал Арел.

Ограничения Лоры

Эффективная методика точной настройки параметров была широко принята из-за ее низкой памяти и вычислительных требований.

Однако, объяснил Арел, он никогда не предназначался для смягчения катастрофических забывений. Когда веса обновляются как часть обучения модели по распределению данных, которое не соответствует исходным учебным данным, полученные искажения трудно предсказать.

«Наши результаты показывают, что, хотя Лора эффективна в вычислительном отношении, она страдает от тех же недостатков, когда дело доходит до потери памяти и рассуждений», — сказал Арел.

Сложность модели также затрудняет выявление и исправление искажений. Кроме того, тонкая настройка через Лору и другие существующие методы могут ослабить или откровенно втягивать меры безопасности, установленные с помощью обучения подкреплению от обратной связи человека (RLHF), что жизненно важно для предотвращения предвзятых и вредных результатов модели.

«Крайне важно отметить, что RLHF также является процедурой обучения,-сказал Арел,-и как таковой затронут так же, как и на знания и рассуждения во время точной настройки».

Существующие процессы смягчения непоследовательных, ненадежных

Одним из современных подходов к смягчению катастрофических забывений является зависимость от большого количества инженеров машинного обучения (ML), которым поручено ограничивать точную настройку как можно больше и полагаться на быстрое разработку для достижения желаемой производительности.

Тем не менее, этот процесс ненадежен и непоследователь в разных моделях, и нет (по крайней мере, на сегодняшний день) понимания того, как, почему и когда он работает. Наборы оценки, которые количественно определяют знания, способность рассуждения и безопасность тонких настроек, также выполняются, в то время как тонкая настройка происходит для «раннего размера» процесса в лучшие моменты времени.

«Эти решения являются дорогостоящими, требуют ручной работы инженеров ML и занимают много времени»,-заявил Арел. «Нет известных способов автоматизировать этот процесс интенсивного человека».

Tenyx демонстрирует значительный прирост безопасности, мастерства и знаний

Арел объясняет, что метод тонкого настройки Tenyx пытается определить подмножество параметров модели, которое можно обновлять, так что обучение новым данным происходит, в то время как модель сохраняет почти все предварительные условные отображения ввода-вывода, объяснил Арел.

Затем платформа проецирует обновления, сделанные в нейронах во время точной настройки в пространство, где они не будут мешать тому, как они снимают информацию о предварительно обученном распределении данных.

«Другими словами, анализируя обученный LLM, наш метод способен определить, как и какой из миллиардов весов могут быть обновлены, так что минимальное или катастрофическое забывание происходит по мере достижения изучения новых данных», — сказал Арел.

По его словам, платформа Tenyx основана на новой математической интерпретации геометрических представлений, образованных во время первоначального обучения LLM. Он фиксирует геометрию данных, представленных в сетях трансформатора, которые поддерживают сегодняшние LLMS.

Эта геометрическая интерпретация позволяет Tenyx выбирать подмножество весов сети и ограничивать обновления выбранных нейронов, «с сильными гарантиями, которые фактически эффективно сохраняются ранее изученными информацией», — сказал Арел.

Метод сохраняет защиту RLHF и соответствует нормативным изменениям — в частности, исполнительным приказом Белого дома по безопасному, безопасному и заслуживающему доверия ИИ.

Благодаря оценке алгоритмов создания популярных предприятий и открытого исходного кода в пилотном исследовании, Tenyx показал следующие возможности:

Безопасность: тонкая настройка Tenyx привела к сокращению на 11%по сравнению с -66%OpenAI, вместе с -94%AI и -91%Lora -91%.
Условное знание: GPT 3,5 Turbo Openai был изначально более опытным, потому что у модели было больше параметров, Llama-2 7B Tenyx была наиболее опытной после точной настройки.
Знание: Tenyx смягчил катастрофическое забывание больше всего с потерей 3%по сравнению с 10%Openai, вместе 40%AI и 43%Лоры.

«Катастрофическое забывание-это хорошо известная проблема в глубоком обучении, которая по-прежнему влияет на даже большие, способные модели»,-сказал Ноа Гудман, доцент в Стэнфордском университете. «При обучении данных из нового домена модели обычно работают лучше в этом домене, непреднамеренно изменяя более ранние возможности».

Он добавил: «У Tenyx есть сильная исследовательская группа, которая изучает важные новые идеи для решения этой сложной задачи».

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Как LLMS попала в современный стек данных в 2023 году

admin 14.06.2025

admin

Когда более года назад CHATGPT дебютировал, пользователи интернета получали постоянно доступный помощник по ИИ, чтобы поболтать и работать. Он занимался их повседневными задачами, от производства содержания естественного языка (например, эссе) до рассмотрения и анализа сложной информации. В кратчайшие сроки, метеорический рост чат -бота привлек внимание мира к технологии, сидящей в своей основе: серии больших языковых моделей GPT (LLMS).

Перенесемся в настоящее время, LLMS-серия GPT и другие-являются движущей силой не только индивидуальных задач, но и массовых бизнес-операций. Предприятия используют коммерческие модели API и предложения с открытым исходным кодом для автоматизации повторяющихся задач и эффективности стимулирования для ключевых функций. Представьте себе, что вы разговариваете с ИИ, чтобы создать рекламные кампании для маркетинговых команд или возможность ускорить операции поддержки клиентов, всплыв правильную базу данных в нужное время.

Воздействие было глубоким. Тем не менее, одна область, где роль LLM не обсуждается так много, является современным стеком данных.

LLMS преобразует стек данных

Данные являются ключом к высокопроизводительным крупным языковым моделям. Когда эти модели обучаются правильно, они могут помочь командам работать со своими данными — независимо от того, экспериментируют ли они с ним или запускают сложную аналитику.

Фактически, за последний год, когда росли CHATGPT и конкурирующие инструменты, предприятия, предоставляющие инструменты данных для предприятий, зацикливались на генеративном ИИ в своих рабочих процессах, чтобы облегчить их клиентам. Идея была проста: нажмите на способность языковых моделей, чтобы конечные клиенты не только получили лучший опыт при обработке данных, но также могли сэкономить время и ресурсы — что в конечном итоге поможет им сосредоточиться на других, более насущных задачах.

Первый (и, вероятно, самый важный) сдвиг с LLMS произошел, когда поставщики начали дебютировать с возможностями разговорного запроса — т.е. получает ответы от структурированных данных (подгоняя данные в строки и столбцы), разговаривая с ним. Это устранило хлопотные комплексные запросы SQL (структурированный язык запросов) и дали команды, в том числе нетехнические пользователи, простой в использовании опыт текста в SQL, где они могли бы поместить на естественные языковые подсказки и получить представление от своих данных. Используемый LLM преобразовал текст в SQL, а затем запустил запрос на целевом наборе данных для генерации ответов.

В то время как многие поставщики запустили эту возможность, некоторые заметные, чтобы сделать их в пространстве, были DataBricks, Snowflake, Dremio, Kinetica и мысли. Kinetica изначально постучала Chatgpt для этой задачи, но теперь использует свой собственный родной LLM. Тем временем Snowflake предлагает два инструмента. Во -первых, копило, который работает в качестве ассистента разговора для таких вещей, как задание вопросов о данных в простом тексте, написание запросов SQL, усовершенствование запросов и фильтрацию вниз. Второй — это инструмент AI документа для извлечения соответствующей информации из неструктурированных наборов данных, таких как изображения и PDF. DataBricks также работает в этом пространстве с тем, что он называет «Lakehouseiq».

Примечательно, что несколько стартапов также появились в одной и той же области, нацеленные на аналитическую область на основе AI. Например, в Калифорнии DATAGPT продает специализированного аналитика для компаний ИИ, который запускает тысячи запросов в кэше молнии своего хранилища данных и получает результаты в разговорном тоне.

Помогая с управлением данными и усилиями по ИИ

Помимо помощи группам генерировать понимание и ответы из их данных с помощью текстовых входов, LLM также традиционно обрабатывают ручное управление данными и усилия по данным, имеющие решающее значение для создания надежного продукта ИИ.

В мае поставщик интеллектуального управления данными (IDMC) Informatica дебютировал в Claire GPT, многопользовательском инструменте по разговору AI, который позволяет пользователям обнаруживать, взаимодействовать и управлять своими активами данных IDMC с входами естественного языка. Он обрабатывает несколько заданий в рамках платформы IDMC, включая обнаружение данных, создание и редактирование конвейеров данных, исследование метаданных, качество данных и исследование отношений и генерацию правил качества данных.

Затем, чтобы помочь командам создать предложения искусственного интеллекта, калифорнийский заправка AI предоставляет специально построенную большую языковую модель, которая помогает с заданиями маркировки данных и обогащения. В статье, опубликованной в октябре 2023 года, также показывается, что LLMS может выполнять хорошую работу по удалению шума из наборов данных, что также является важным шагом в создании надежного ИИ.

Другими областями в разработке данных, где LLMS может вступить в игру, являются интеграция данных и оркестровая. Модели могут по существу генерировать код, необходимый для обоих аспектов, независимо от того, нужно ли преобразовать различные типы данных в общий формат, подключаться к различным источникам данных или запрос для шаблонов кода YAML или Python для построения DAGS.

Гораздо больше

Прошло всего год с тех пор, как LLMS начали делать волны, и мы уже видим так много изменений в домене предприятия. По мере того, как эти модели улучшаются в 2024 году, и команды продолжают внедрять инновации, мы увидим больше приложений языковых моделей в различных областях стека корпоративных данных, включая постепенно развивающее пространство наблюдаемой наблюдения данных.

Монте -Карло, известный поставщик в этой категории, уже запустил исправление с помощью ИИ, инструмента, который обнаруживает проблемы в трубопроводе данных и предлагает код исправить их. Acceldata, еще один игрок в пространстве, также недавно приобрел Bewgle, чтобы сосредоточиться на интеграции LLM для наблюдения данных.

Однако, когда эти приложения появятся, для команд также станет более важным, чем когда-либо, чтобы убедиться, что эти языковые модели, созданные с нуля или настраиваемые, работают прямо на марке. Небольшая ошибка здесь или там, и вниз по течению может быть затронута результат, что приведет к сломанному каким -либо каким -либо каким -либо каким -либо каким -либо образом.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

5 лучших историй данных 2023 года: Play Microsoft в облачной войне, получение данных DataBricks и многое другое

admin 14.06.2025

admin

2023 год был годом генеративного ИИ. Однако, поскольку каждая компания стремилась укрепить свою стратегию ИИ, они также реализовали ценность чистых и высококачественных данных, возвращаясь к необходимости надежной инфраструктуры в смесь. От Snowflake до Microsoft, поставщики экосистемы данных обналичили эту возможность и перемещались, иногда даже приобретали известных игроков, чтобы дать своим клиентам возможность использовать свои данные для различных приложений искусственного интеллекта, а также внедрить различные возможности искусственного интеллекта в свои продукты.

Это 5 лучших историй данных VentureBeat 2023 года

1. Microsoft, чтобы победить Amazon и Google в облачной войне

В мае Microsoft анонсировала Fabric-сквозную аналитическую платформу, которая объединяет все инструменты данных и инструменты аналитики, включая Azure Synapse Analytics и Power BI, в один унифицированный продукт. Мы поговорили с аналитиками, чтобы понять, что делает это предложение, которое направлено на то, чтобы разблокировать потенциал данных и заложить основу для ИИ, уникальный и может помочь Microsoft «Leapfrog» Amazon и другими облачными поставщиками, такими как Google. По крайней мере, когда дело доходит до обслуживания крупных корпоративных компаний.

«В связи с тем, что все эти возможности собираются вместе, Microsoft определенно имеет небольшое преимущество перед другими гиперспешами на данный момент», — сказал VentureBeat Ноэль Юханна, аналитик Forrester.

2. Рост векторной базы данных, новый вид базы данных для эпохи ИИ

Поскольку генеративный ИИ является точкой разговора для каждого бизнеса, Чарльз Xie, генеральный директор и основатель Zilliz, обсудил рост векторных баз данных, новую категорию управления базами данных и сдвиг парадигмы для использования экспоненциальных объемов неструктурированных данных, находящихся в непонтер в хранилищах объектов. Векторные базы данных обеспечивают новую мысль о новом уровне возможности поиска неструктурированных данных, в частности, но могут также заняться полуструктурированными и даже структурированными данными. Xie также рассказал о том, как компании должны обращаться к векторным базам данных, чтобы нацелиться на их соответствующие варианты использования.

3. Приобретение DataBricks ‘1,3 миллиарда долларов MOSAICML

DataBricks попала в заголовки газет перед ежегодным саммитом в июне, когда он объявил о приобретении компании AI MosaicML за 1,3 миллиарда долларов. Идея заключалась в том, чтобы привлечь модели Mosaicml и модели искусственного интеллекта под его зонтиком, предоставив предприятиям объединенную платформу, где они могут управлять активами данных и использовать их для создания безопасных генеративных приложений искусственного интеллекта.

«Каждая организация должна быть в состоянии извлечь выгоду из революции ИИ с большим контролем над тем, как используются их данные. Databricks и Mosaicml имеют невероятную возможность демократизировать ИИ и сделать Лейкхаус лучшим местом для создания генеративных ИИ и LLM», — сказал Али Годси, соучредитель и генеральный директор Databricks.

4. Salesforce партнеры за более сильные основы данных

За последний год гигантские Salesforce Giant Management Customer Management (CRM) усилили свою стратегию ИИ с помощью нескольких улучшений продукта. Чтобы поддержать эти инициативы, в сентябре компания, возглавляемая Марком Бениоффом, объявила, что ее собственное облако данных, которое объединяет информацию из разных источников для размещения единых профилей клиентов в режиме реального времени, будет поддерживать двунаправленный обмен данными и доступ к платформе Databricks Data Lakehouse и облако данных Snowflake.

Этот шаг позволяет совместным клиентам компаний обогащать свои наборы данных и питать дополнительные варианты использования, включая создание и развертывание более способных моделей, ориентированных на различные критически важные проблемы.

5. Документ Снежинки для неструктурированного поиска данных

Snowflake поднял волны в июне с запуском документа AI, нового инструмента с большой языковой моделью (LLM), который позволяет предприятиям быстро извлекать стоимость из их заграждения неструктурированных документов (представьте себе счета -фактуры PDF). Этот шаг ознаменовал серьезную разработку компании, которая началась с акцента на структурированных данных, давая командам простой способ мобилизации полезной неструктурированной информации, которая часто остается разбросанной по всем бункеру.

«Мы разблокируем новую эру данных для клиентов, используя ИИ и устранение бункеров, ранее связанных форматом, местоположением и многим другим, чтобы революционизировать, как организации поставляют свои данные на работу и проводят информацию с облаком данных», — сказал Snowflake SVP из Product Christian Kleinerman.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Насколько важна объяснение? Применение принципов клинических испытаний к тестированию безопасности ИИ

admin 14.06.2025

admin

Использование ИИ в предприятиях, ориентированных на потребителя, растет-как и в долгосрочной перспективе, как и в долгосрочной перспективе. Давление на лучшее управление ИИ растет только с недавним исполнительным приказом администрации Байдена, который предписывал новые протоколы измерения для разработки и использования передовых систем ИИ.

Сегодня поставщики ИИ и регулирующие органы очень сосредоточены на объяснении как столпе управления ИИ, что позволяет тем, кто пострадал от систем ИИ, наилучшим образом понимать и оспаривать результаты этих систем, включая предвзятость.

В то время как объяснение ИИ является практичным для более простых алгоритмов, как и те, которые используются для утверждения автомобильных кредитов, более поздняя технология ИИ использует сложные алгоритмы, которые могут быть чрезвычайно сложными для объяснения, но все же обеспечивают мощные преимущества.

GPT-4 OpenAI обучается огромным количествам данных, с миллиардами параметров и может выпускать человеческие разговоры, которые революционизируют целые отрасли. Точно так же модели скрининга рака Google DeepMind используют методы глубокого обучения для построения точного обнаружения заболеваний, которые могут спасти жизни.

Эти сложные модели могут сделать практически невозможным отслеживать, где было принято решение, но это может даже не иметь смысла. Вопрос, который мы должны задать себе: должны ли мы лишать мир этих технологий, которые являются только частично объяснимыми, если мы можем обеспечить их выгоду, ограничивая вред?

Даже американские законодатели, которые стремятся регулировать ИИ, быстро понимают проблемы, связанные с объяснение, выявляя необходимость в другом подходе к управлению ИИ для этой сложной технологии — еще более сосредоточенной на результатах, а не только на объяснения.

Работа с неопределенностью в отношении новых технологий не нова

Сообщество медицинских наук давно признало, что во избежание вреда при разработке новых методов лечения необходимо сначала определить, каким может быть потенциальный вред. Чтобы оценить риск этого вреда и уменьшить неопределенность, было разработано рандомизированное контролируемое исследование.

В рандомизированном контролируемом исследовании, также известном как клиническое исследование, участники назначаются для лечения и контрольных групп. Группа лечения подвергается воздействию медицинского вмешательства, а контроль — нет, и наблюдаются результаты в обеих когортах.

Сравнивая две демографически сопоставимые когорты, может быть идентифицирована причинность, то есть наблюдаемое воздействие является результатом конкретного лечения.

Исторически, медицинские исследователи полагались на стабильный дизайн тестирования, чтобы определить долгосрочную безопасность и эффективность терапии. Но в мире ИИ, где система постоянно учится, новые преимущества и риски могут появляться каждый раз, когда алгоритмы переподготовлены и развернуты.

Классическое рандомизированное контрольное исследование может быть не подходит для цели для оценки рисков ИИ. Но в аналогичной структуре может быть полезность, например, A/B -тестирование, которая может измерить результаты системы AI навсегда.

Как A/B -тестирование может помочь определить безопасность искусственного интеллекта

За последние 15 лет A/B -тестирование широко использовалось в разработке продукта, где группы пользователей обрабатываются по -разному для измерения воздействия определенных продуктов или опытных функций. Это может включать в себя определение того, какие кнопки более кликируются на веб -странице или мобильном приложении, и когда время от времени маркетинговой электронной почты.

Бывший глава экспериментов в Бинге, Ронни Кохави, представил концепцию непрерывных экспериментов в Интернете. В этой структуре тестирования пользователи Bing были случайным образом и непрерывно выделены либо на текущую версию сайта (контроль), либо новую версию (обработка).

Эти группы постоянно контролировались, а затем оценивались по нескольким показателям, основанным на общем воздействии. Рандомизация пользователей гарантирует, что наблюдаемые различия в результатах между лечебными и контрольными группами обусловлены интервенционным лечением, а не чем -то другим, таким как время суток, различия в демографии пользователя или какое -то другое лечение на веб -сайте.

Эта структура позволила технологическим компаниям, таким как Bing, а затем Uber, Airbnb и многие другие — внести итеративные изменения в своих продуктах и пользовательском опыте и понять эти изменения в ключевых бизнес -метриках. Важно отметить, что они создали инфраструктуру для этого в масштабе, и эти предприятия в настоящее время управляют потенциально тысячами экспериментов одновременно.

Результатом является то, что многие компании теперь имеют систему для итеративных тестирования изменений в технологии против контроля или эталона: тот, который может быть адаптирован для измерения не только для бизнеса, таких как ClickThrough, продажи и доходы, но также причинно идентифицируют такие вреда, как разнородное воздействие и дискриминация.

Как выглядит эффективное измерение безопасности ИИ

Например, крупный банк может быть обеспокоен тем, что их новый алгоритм ценообразования для личных кредитования является несправедливым в обращении с женщинами. В то время как модель не использует защищенные атрибуты, такие как пол, явно, бизнес обеспокоен тем, что прокси для пола могли использоваться при обучении данных, и поэтому она устанавливает эксперимент.

Те, кто находится в группе лечения, по цене этого нового алгоритма. Для контрольной группы клиентов были приняты решения о кредитовании с использованием контрольной модели, которая использовалась в течение последних 20 лет.

Предполагая, что демографические атрибуты, такие как пол, известны, распределены одинаково и достаточного объема между лечением и контролем, разрозненным воздействием Между мужчинами и женщинами (если он есть) может быть измерено и поэтому ответит, является ли система ИИ справедливой в обращении с женщинами.

Воздействие ИИ на людей может также происходить медленнее для контролируемого развертывания новых функций продукта, где эта функция постепенно выпускается в большую долю пользовательской базы.

В качестве альтернативы, лечение может быть ограничено меньшим, менее рискованным населением в первую очередь. Например, Microsoft использует Red Teaming, где группа сотрудников взаимодействует с системой ИИ нацеленным способом проверки его наиболее значительного ущерба, прежде чем выпустить ее для населения в целом.

Измерение безопасности ИИ обеспечивает ответственность

В тех случаях, когда объясняемость может быть субъективной и плохо изученной во многих случаях, оценка системы ИИ с точки зрения ее результатов на различных популяциях, обеспечивает количественную и протестированную структуру для определения того, действительно ли алгоритм ИИ является вредным.

Критически, это устанавливает ответственность за систему ИИ, где поставщик ИИ может нести ответственность за надлежащее функционирование и согласование системы с этическими принципами. Во все более сложных средах, в которых пользователи обрабатываются многими системами ИИ, непрерывные измерения с использованием контрольной группы могут определить, какая обработка искусственного интеллекта нанесла вред и привлечет к ответственности обработки.

Несмотря на то, что объясняемость остается повышенной целью для поставщиков ИИ и регулирующих органов в разных отраслях, методы, впервые используемые в здравоохранении, а затем приняты в технологии для борьбы с неопределенностью, могут помочь достичь универсальной цели — что ИИ работает так же, как предполагалось, и, самое главное, безопасно.

Кэролайн О’Брайен является главным директором по данным и руководителем продукта в Afiniti, клиентской компании по опыту искусственного интеллекта.

Элазер Р. Эдельман — профессор Эдварда Дж. Потраса в области медицинской инженерии и науки в MIT, профессор медицины в Гарвардской медицинской школе и старший врач в отделении коронарной помощи в Бригаме и женской больнице в Бостоне.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Новая Carcast: Metrics имеет значение? Кроме того, размышляя о стратегии ИИ и значении жизни

admin 14.06.2025

admin

В Carcast на этой неделе мы обсуждаем технологические и бизнес -прогнозы на 2024 год, вашу стратегию ИИ предприятия и то, как вы можете измерить свою жизнь.

https://www.youtube.com/watch?v=QALVXJCCXE

Основные моменты Carcast:

Бен Эванс «ИИ и все остальное» Манифест;
Метрики не имеют значения и почему GAAC мертв;
Amazon Way: генеральные директора должны быть необоснованно оптимистичными и гиперреалистичными одновременно;
Прогнозы 2024: Эффективность GTM, управляемая AI, и ИИ поднимаются по циклу шумиха.
Ключевые соображения для технических руководителей, чтобы сделать стратегию искусственного интеллекта реальной в 2024 году.

Carcast также включает в себя такие дополнения, как «Как вы будете измерять свою жизнь?», Своевременное резюме философии Клейтона Кристенсена о значении жизни и ее измерениях.

Бруно Азиза — технологический предприниматель.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Ask-Ai получает 11 миллионов долларов для поддержки поддержки и многое другое с помощью «Ask» Chrome расширение

admin 13.06.2025

admin

Поддержка клиентов является одной из наиболее очевидных областей для предприятий для развертывания решений искусственного интеллекта — но сделано неправильно, это может быть большим образом, так как мы узнали из различных автомобильных дилерских центров Chevrolet, которые предпочитали использовать версию GPT Openai только для того, чтобы клиенты начали обманывать его, чтобы предоставить им скидки на автомобили до 1 доллара.

Но Ask-AI использует другой подход, запуская новую модель Agnostic Enterprise Assistant Ai Assistant в качестве сегодняшнего расширения Chrome под названием Ask, который предназначен для того, чтобы расширить возможности агентов поддержки людей, предоставляя им контекстуальные данные в реальном времени о клиенте, с которыми они взаимодействуют в данный момент, ответы на общие вопросы и знания о предложениях и решениях своей компании-в порядке их ноги.

Основан для расширения возможностей человеческих агентов и сотрудников с ИИ

Основанная в Тель-Авиве, Израиль, в 2021 году, предпринимателем Алоном Талмором, а также совместно с крупным офисом в Торонто, Канада, сегодня также объявила, что она привлекла 11 миллионов долларов в финансировании серии A, во главе с фондом лидеров и поддержанным семенными инвесторами, включая Vertex Ventures, State Ventures, Gtmfund и других. В общей сложности, считая свой более ранний раунд семян, Ask-AI собрал более 20 миллионов долларов.

Ask-Ai Команда с основателем Алоном Талмором впереди справа. Кредит: Ask-AI.

«Мы считаем, что на пересечении того, что вы (пользователь Enterprise) станет большой рынок, на пересечении того, что вы (пользователь предприятия) делаете прямо сейчас-допустим, что повторяющаяся задача, такая как ответ на электронную почту, ответа на билет на поддержку клиентов или просто выполнение своей работы в вашем CRM (программное обеспечение для управления взаимоотношениями с клиентами)-и с помощью данных компании и ИИ»,-сказал Талмор в Excutive Offormentsements.

Спросите это ИИ на стороне, когда это необходимо

Талмор описал, как работает новый Ask Sidekick: как расширение браузера Chrome, которое кажется боковой панелью и «открывается автоматически, в зависимости от того, что вы делаете», чтобы предоставить приложения и информацию, относящуюся к любой работе, которую вы выполняете в данный момент.

Спросите: «Не только делайте (ы), что вы делаете то, что делаете быстрее — предоставляя ответы на электронные письма и билеты, но и делаете это лучше и эффективнее».

Например, Талмор отметил, что для обслуживания клиентов и персонала поддержки Ask предоставляет «360 представление о том, что мы знаем» о каждом данном клиенте, который ранее взаимодействовал с бизнесом и ищет поддержку от агента.

Ask Ask Insust включает в себя «все соответствующие прошлые взаимодействия и основные моменты о том, что интересно в этом клиенте — их обновление?

Кроме того, Ask может выполнить «Действия вокруг генеративного искусственного интеллекта, например, отвечая на тонус компании», через проекты по электронной почте или чату клиента, «Отвечая на вопросники, выполняя аудит поддержки, существует широкий спектр приложений, которые мы действительно можем очень быстро создавать и добавить к этой (Ask) платформе Sidekick, чтобы принести ценность».

Важно отметить, что Ask AI Sidekick не действует сам по себе: каждый агент по поддержке клиентов должен принять или использовать информацию и ответы, полагаясь на их обучение и суждение, чтобы избежать видов ошибок и высоких обещаний полностью автоматизированных чат -ботов поддержки клиентов.

Высокая безопасность, высокая токальность, низкий уровень галлюцинации

Талмор также подчеркнул приверженность Айа-Ай сократить галлюцинации и воплощать ценности своей компании создания «очень высокой точности, решений высокой безопасности».

Он сказал, что Ask-AI делает это и отличает себя от других конкурентов в области поддержки клиентов, выполняя «реальную предварительную обработку и суммирование данных компании (клиента)», включая понимание уникального внутреннего жаргона компании.

Ask-AI также поддерживает широкий спектр ведущих моделей ИИ для питания своих предложений, в том числе GPT-3,5/4 Openai, Google Gemini, Meta с открытым исходным кодом и ее вариантов, таких как альпака.

Продукты искусственного интеллекта, которые подключаются и переваривают данные из существующих приложений — не требуется переключение

Основным преимуществом всего предложения Ask-AI, которое также включает в себя обезжиренную, богатую информацией панель в реальном времени под названием «Mosaic», заключается в том, что она может быть подключена к более чем 50 другими популярными предприятиями в общем использовании, включая Salesforce, Zendesk, Confluence и Slack, переваривание и анализ данных из этих источников, в отличие от разрешения Enterprise Culdess.

Это означает, что клиенты Ask-AI не должны рассматривать возможность переключения или отказ от корпоративного программного обеспечения, на которое они уже полагаются, и заплатить, и это хорошо подходит для их бизнеса.

Вместо этого, Sidekick и Dashboard Ask-AI просто расширяют и улучшают данные, уже создаваемые и хранящиеся этими другими сторонними приложениями и инструментами.

Обсуждая мозаичную панель Ask-AI, Талмор сказал VentureBeat, что «вы можете визуально увидеть, что являются повторяющимися проблемами и проблемами не только в билетах ваших клиентов, но и, например, в простых разговорах внутри компании… есть много болтовни в каналах компании, и вы хотите захватить это, чтобы повысить эффективность в компании».

Рекламное изображение мозаичной панели мозаики Айа. Кредит: Ask-AI

Ask-AI считает, что результат использования обоих продуктов-его панели панели и Ask Sitekick-является значительным повышением эффективности в разных отделах, от поддержки клиентов до продаж, путем предоставления ключевых идей и действенных решений в режиме реального времени.

Несмотря на то, что изначально ориентируясь на агентов поддержки клиентов с помощью своего Ask Sidekick, Ask-AI также стремится обеспечить ценность другим сотрудникам предприятия, таким как аналитики и руководители, которые могут найти огромную ценность на панели панели.

Это сквозное решение показало осязаемые результаты по разнообразным клиентуре Ask-AI, которая включает в себя такие имена, как Monday.com, Callrail и Yotpo, достигая таких показателей, как сокращение времени в разрешении на 20% для получения поддержки.

Предыдущий успех с искусственным искусством предприятия

Предыдущий Bluetail Talmor Ai Venture был приобретен Salesforce, Ask-AI выполнял миссию по интеграции генеративного ИИ в ткань предприятий.

Талмор имеет докторскую степень по обработке естественного языка, а в его команде входят другие опытные профессионалы и ученые, в том числе профессор Джонатан Берант, Джош Соломон, Дафна Лавран и Медар Эяль.

С новым финансированием компания планирует удвоить размер в этом году.

Недавнее финансирование и инновационный подход Ask-AI к интеграции генеративного ИИ в корпоративные рабочие процессы могут помочь ему выделиться среди все более многолюдного пространства новых предложений по искусственному искусству.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Секрет приготовления языковых моделей полезными

admin 13.06.2025

admin

Если вы описали свои симптомы для меня как бизнес -лидера, и я набрал их в CHATGPT, вы бы хотели, чтобы я генерировал и назначил план лечения, отправляя заказы своему местному фармацевту — без консультации с врачом?

Что если вам предложили торговлю: ведущие ученые в мире присоединятся к вашей организации, но с уловами, что каждый из ваших бизнес -экспертов должен присоединиться к вашему конкуренту, оставляя только данные для работы, и нет экспертов для обеспечения контекста?

В эпоху ИИ общественная площадь заполнена голосами, рекламирующими возможности, риски, угрозы и рекомендуемые практики для принятия генеративного ИИ-особенно языковых моделей, таких как GPT-4 или Bard. Новые модели с открытым исходным кодом, прорывы исследований и запуск продуктов объявляются ежедневно.

В разгар этого рыночного импульса акцент был сделан на возможности языковых моделей, но язык полезен только в сочетании со знаниями и пониманием. Если бы кто -то запомнил все слова в словаре, которые были связаны с химией и могли читать без знаний или понимания основных принципов, этот язык был бы бесполезным.

Получить рецепт правильно

Для языковых моделей это идет еще дальше и может вводить в заблуждение, потому что модели могут не только читать связанные слова, но и основные документы, структуры, фразы и рекомендации, которые были написаны экспертами.

Например, когда они попросили генерировать новый рецепт, они могут использовать корреляции между предыдущими рецептами и описаниями для создания нового рецепта, но они не знают, что вкусно — или даже то, что представляет собой опыт дегустации. Если нет никакой корреляции между смешиванием оливкового масла, кетчупа и персиков в прошлых рецептах, модели вряд ли будут смешивать эти ингредиенты — не потому, что они обладают знаниями или пониманием того, что вкусно, а из -за отсутствия корреляции между этими ингредиентами в своем наборе набора данных.

Таким образом, рецепт хорошего вкуса, созданный языковой моделью, является статистической вероятностью, за которую мы можем поблагодарить экспертов, рецепты которых были включены в исходные данные. Языковые модели являются мощными, и секретный ингредиент для их того, чтобы сделать их полезными, является опытом.

Экспертиза сочетает в себе язык со знаниями и пониманием

Фраза «корреляция не равна причинно-следственной связи» хорошо известна теми, кто работает с данными. Это относится к тому факту, что вы можете нарисовать ложную корреляцию между двумя не связанными вещами, неверно истолковывая связь, чтобы подразумевать, что одна вызвала другое, например, петух утра утром, приказывающим восхождение солнца.

Машины чрезвычайно полезны для выявления корреляций и моделей, но требуется опыт, чтобы определить, подразумевают ли эти истинные причины, и должны информировать о принятии решений (например, инвестировать в обучение петухов, чтобы вырушить на час раньше, чтобы получить дополнительный час дневного света).

В человеческом опыте обучения язык — только первый шаг. В детстве получают язык для маркировки вещей, людей, мест, глаголов и многого другого, их лиц, осуществляющие уход, используют его, чтобы привить знания. Мы живем на планете под названием Земля. Этот мяч в небе называется солнцем. Следующим шагом является понимание причины и следствия (причинность или причинность): солнце в небе заставляет вашу кожу чувствовать себя тепло. Прыжок в холодное озеро может охладить вас вниз.

К тому времени, когда мы прибываем во взрослую жизнь, мы усвоили сложные структуры опыта, которые состоят из языка, знаний (что) и понимания (почему).

Воссоздание структуры опыта

Рассмотрим любую тему. Если у вас есть язык без знаний или понимания, вы не эксперт. Я знаю, что у традиционного автомобиля есть трансмиссия, двигатель с поршнями, бензобак — у меня есть язык о автомобилях.

Но есть ли у меня знания? Я знаю, что автомобиль доставляет газ в двигатель посредством впрыскивания топлива, и есть реакция, связанная с стрельбой по поршням, и что это имеет решающее значение для продвижения автомобиля вперед. Но понимаю ли я, почему? И если это перестанет работать, я бы знал, как это исправить? К большому огорчению моего учителя в магазине средней школы мне нужно было бы нанять эксперта, который понял почему и знал, как это исправить, научился в практическом опыте.

Перевод этого в машинный контекст, языковые модели без знаний (представленные графами знаний и моделями) или понимание (представленное причинными моделями), никогда не должны принимать решения, поскольку они не имеют опыта. Языковая модель, принимающая решение самостоятельно, — это все равно, что дать набор инструментов и доступ к вашему автомобилю человеку, который запомнил только следующее, наиболее вероятное слово обо всем, что связано с автомобилями.

Итак, как мы используем потенциал языковых моделей, воссоздавая структуру опыта в машинах?

Начните с опыта и работать в обратном направлении

Машинное обучение (ML) и машинное обучение являются субдисциплинами в области перевода человеческого опыта на машинный язык, так что машины могут информировать человеческие решения, либо автономно принимать решения. Это может освободить человеческую способность сосредоточиться на решениях и обнаружении, которые либо слишком нюансы, либо для которых недостаточно данных, чтобы перевести на машинный язык.

ML начинается с вопроса о том, как лучше снабжать машины для обучения, а обучение машины начинается с вопроса о том, как лучше снабжать людей для обучения машинах.

Наиболее распространенным заблуждением в дискуссиях об ИИ и ML является то, что данные являются наиболее важным элементом, но опыт является наиболее важным элементом. В противном случае, что такое модель обучения? Конечно, это идентифицирует закономерности, классификации и расчесывание через миллионы строк данных за секунды. Но что делает эти шаблоны полезными?

Когда эксперт определил, что шаблон может проинформировать о решении, которое приносит пользу организации и ее клиентам, этот опыт может быть переведен на машинный язык, и машину можно научить связывать этот шаблон с бизнес -правилами и автономно принимать полезные решения.

Следовательно, процесс перевода опыта в машины не начинается с данных, он начинается с опыта и работает в обратном направлении. Примером этого является то, что оператор машины замечает, что определенные звуки, которые машина делает корреляцию с необходимыми корректировками. Когда он делает высокий свисток, например, температуру необходимо отказаться. Помимо полной рабочей нагрузки, оператор слушает в течение дня, если машина издает один из этих звуков. Нет существующих данных, которые соответствуют этой ситуации, но есть опыт.

Работать задом наперед из этого опыта довольно проста. Установите датчики, которые обнаруживают звуки, изготовленные машиной, затем работайте с экспертом, чтобы коррелировать эти звуки (частоты и комбинации децибел), чтобы внести необходимые корректировки для машины. Этот процесс может быть выгружен в автономную систему, освобождая время оператора для выполнения других обязанностей.

Определите наиболее критический опыт

Процесс построения решений ИИ должен начинаться с вопроса о том, какой опыт является наиболее важным для организации, за которым следует оценка уровня риска, связанного с потерей этой экспертизы или потенциального роста разгрузки этого экспертного решения на машину.

Есть ли в организации только один человек, который понимает этот процесс или как исправить систему, когда она снижается? Тысячи сотрудников следуют за тем же процессом каждый день, который можно было бы разгружаться в автономную систему, что освобождает дополнительные 30 минут в своих ежедневных календарях?

Третий шаг состоит в том, чтобы оценить, какой из тех, кто связан с наивысшей степенью риска или потенциального роста, может быть переведен на машинный язык. Это шаг, когда данные и инструменты (такие как языковые модели) вступают в разговор в качестве способного перевода опыта на машинный язык и взаимодействие с машинами.

К счастью для большинства организаций, основание для строительных экспертных систем уже была заложена, и в качестве отправной точки языковые модели могут либо ссылаться на то, чтобы ссылаться на опыт, который был запрограммирован в них.

Исследование в отношении операций

В ближайшее десятилетие мы увидим встряхивание секторов рынка, основанную на их инвестициях в ИИ.

Предупреждающей историей является появление видео по требованию: Netflix внедрил потоковую передачу в 2007 году. Блокбастер, поданный на банкротство три года спустя, несмотря на то, что в 1995 году инкубировал и пилотировал блокбастер по требованию.

К тому времени, когда конкурент вводит продукт или услугу, который достаточно продвинут с значимыми и дифференцированными приложениями ИИ, скорее всего, будет слишком поздно, чтобы разобраться или «быстро последуем», особенно с учетом времени и опыта, необходимых для разработки надежных приложений.

К 2030 году имена нарицательных, которые мы сейчас почитаем, присоединятся к ряду вместе с блокбастером, потому что они решили быстро следовать, и к тому времени, когда они увидели рыночные силы, которые будут их кончиной, было слишком поздно.

Вместо того, чтобы планировать ждать и отреагировать на инвестиции и события разработчиков, лидеры должны начать с вопроса о том, чего они могли бы достичь на рынке, что потребовало бы, чтобы все остальные могли сражаться, чтобы отреагировать на них.

В эпоху автономного преобразования организациями, которые лучше всего подходят для сохранения или расширения своей позиции на рынке, будут те, которые инвестируют в передачу оперативного опыта на машины и установление видения будущего рынка и той ценности, которую их организация может создать, вводя в эксплуатацию экспедиции в неизвестность, чтобы обнаружить, может ли это видение быть реализовано, в то время как он строго переведет открытия в каждую стоимость.

Брайан Эвергрин является основателем прибыльной хорошей компанииПолем Эта статья была написана в сотрудничестве с Роном Норрисом, директором по эксплуатации в инновациях в Грузия-Тихоокеанский региони Майкл Кэрролл, вице-президент по инновациям в Грузии-Тихоокеанском регионе.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Стабильность AI выпускает стабильный код 3B, чтобы заполнить пробелы из генерации кода, способствующего AI,

admin 13.06.2025

admin

Генеративное генерация кода с питанием от ИИ становится более мощным и более компактным.

Стабильность AI, поставщик, который, возможно, наиболее известен своим стабильным диффузионным текстом для генеративной технологии ИИ, сегодня объявил о своей первой новой модели ИИ в 2024 году: коммерчески лицензированный (через членство) стабильный код 3B.

Поскольку имя модели подразумевает стабильный код 3b является моделью параметров 3 миллиарда, и оно сосредоточено на возможностях завершения кода для разработки программного обеспечения.

В 3 миллиардах параметров стабильный код 3B может работать локально на ноутбуках без выделенных графических процессоров, в то же время обеспечивая конкурентную производительность и возможности против более крупных моделей, таких как Meta’s Codellama 7B.

Направление к более мелким, более компактным и способным моделям — это то, что AI стабильности начал продвигать вперед в конце 2023 года с такими моделями, как Stablelm Zephyr 3B для генерации текста.

Стабильность AI впервые предварительно просмотрел стабильный код в августе 2023 года с первоначальным выпуском Generation LLM и с тех пор неуклонно работает над улучшением технологий.

Как стабильность AI улучшила стабильный код 3b

Стабильность AI имеет улучшенный стабильный код несколькими способами с момента первоначального выпуска.

С новым стабильным кодом 3B модель не только предлагает новые строки кода, но также может заполнить более широкие пропущенные разделы в существующем коде.

Возможность заполнения пропущенных разделов кода является расширенной возможностью завершения кода, известной как заполнение в середине (FIM).

Обучение для модели была также оптимизирована с расширенным размером контекста с использованием методики, известной как вращающееся встроенные положения (веревка), при желании позволив длину контекста до 100 тыс. Токенов. Техника веревки — это та, которую также использует другие LLM, в том числе LlaMa 2 LlaMa 2.

Стабильный код 3B построен на стабильной модели LM 3B LM 3B. Благодаря дальнейшему обучению, ориентированному на данные разработки программного обеспечения, модель приобрела навыки завершения кода, сохраняя при этом сильные стороны в общих языковых задачах.

Его данные обучения включали репозитории кода, форумы программистов и другие технические источники.

Он также обучался на 18 различных языках программирования, а AI стабильности утверждает, что стабильный код 3B демонстрирует ведущую производительность на контрольных тестах на нескольких языках.

Модель охватывает популярные языки, такие как Python, Java, JavaScript, Go, Ruby и C ++. Ранние тесты указывают на то, что он соответствует или превышает качество завершения моделей в два раза в два раза.

Рынок для генеративных инструментов генерации кодов искусственного интеллекта конкурентоспособен с несколькими инструментами, включая Meta’s Codellama 7b, является одним из самых больших и популярных вариантов.

На стороне параметра в 3 миллиарда LLM StarCoder, который является совместно разработанным как усилие с открытым исходным кодом с участием IBM, HuggingFace и ServiceNow, является еще одним популярным вариантом.

Стабильность AI претендует на стабильный код 3B превосходит StarCoder через Python, C ++, JavaScript, Java, PHP и Rust -Languages.

Часть подписки на членство в стабильности

Стабильный код 3B предоставляется для коммерческого использования в рамках новой службы подписки на участие в стабильности AI, которая была впервые объявлена в декабре.

Участники получают доступ к стабильному коду 3B вместе с другими инструментами искусственного интеллекта в портфеле AI Stability, включая инструменты генерации Diffusion Image SDXL, StableLm Zephyr 3B для генерации текстового контента, стабильный аудио для генерации звука, стабильное видео для генерации видео.

Источник

ИИ в бизнесе ИИ в искусстве ИИ в науке

Дебюты пекана AI Прогнозируют генеративный ИИ для демократизации прогнозов искусственного интеллекта для бизнеса

admin 13.06.2025

admin

До того, как генеративный ИИ стал массовой отраслевой тенденцией, которой он является сегодня, был прогнозирующий ИИ, который, как следует из названия, помогает предоставить прогнозы о будущих событиях, основанных на данных. Но что, если бы вы могли объединить обе технологии в одну?

Это цель пекана AI. Восьмилетний стартап уже предлагает платформу прогнозирующей аналитики для предприятий и с момента его старта привлекла 116 миллионов долларов США, включая раунд в размере 66 миллионов долларов в феврале 2022 года.

Сегодня компания запускает новый инструмент, Predictive Genai, который сочетает в себе некоторые возможности современных генеративных возможностей ИИ с прогнозирующим машинным обучением.

«В то время как мы работали на нашей стороне соседства над классическими программами Analytics Solutions Classic Learning, на другой стороне района произошла вся революция Gen AI»,-сказал VentureBeat Зохар Бронфман, генеральный директор и соучредитель Pecan AI. «Одна вещь Gen AI ужасен, это создание прогнозов».

Хотя Gen AI не идеально подходит для прогнозирования, методы прогнозного машинного обучения не особенно удобны для пользователя. Прогнозирующий Genai от Pecan AI смешивает оба подхода, позволяющие ученым -ученым, которые теперь легче создавать и генерировать прогнозирующие модели ИИ.

Сделать предиктивный ИИ доступным для бизнес -пользователей

Ключевой целью для AI Pecan является помочь компаниям принять машинное обучение и ИИ самым простым способом.

Исторически, ученые -данные были основными пользователями платформ ИИ и, в частности, технологией прогнозного машинного обучения.

Бронфман сказал, что Pecan AI предназначен для доступности и стремится демократизировать возможности ИИ и довести его к людям, которые ближе к деловой стороне вещей внутри компаний.

Существует две части в предсказательную возможность Пекана ИИ.

Предсказательный чат-это функция, которая позволяет пользователям задавать запросы естественного языка через интерфейс в стиле чат-бот. Бронфман сказал, что цель состоит в том, чтобы помочь пользователю, у которого есть конкретная бизнес -проблема, более легко использовать конкретную предиктическую структуру, которая соответствует необходимости бизнеса.

Новая предиктивная ноутбука использует генеративный ИИ для создания ноутбука по науке о данных, который используется в качестве основы для построения прогнозирующей модели. Бронфман объяснил, что предиктивная записная книжка — это проприетарная записная книжка пекана AI, основанная на SQL. Он содержит сгенерированные ячейки, которые определяют преобразование нативных данных компании в набор данных A-i-yi-read для прогнозного моделирования. Каждая сгенерированная ячейка отвечает за элемент этого преобразования, такой как запросы, структурирование и соединение данных. Ячейки могут автоматически запускать в бэкэнд пекана AI прозрачным образом для пользователя. Однако, если пользователь хочет принять более глубокое участие, он может настроить ячейки с помощью SQL. В конце процесса ноутбук создает набор запросов, которые применяются к таблицам данных пользователя, чтобы преобразовать их из их собственного состояния в набор данных с AI, для библиотеки моделирования Pecan AI.

Почему обычный Gen AI не может предсказать (ну, если вообще)

Как известно, Gen AI хорош во многих разных вещах, таких как создание чат -ботов, суммирование контента и написание отчетов.

По мнению Бронфмана, Gen AI само по себе, однако, не подходит для прогнозирования по нескольким причинам.

Он сказал Venturebeat, что инструменты Gen Gen Gen, которые подвергаются воздействию во время обучения, не находятся в надлежащем формате AI-reade, необходимого для прогнозного моделирования.

Бронфман объяснил, что для прогнозирующей модели набор данных должен иметь каждую строку в качестве отдельного объекта, причем каждый столбец представляет определенную функцию и столбец метки для целевой переменной.

Однако в реальных сценариях бизнеса для получения наборов данных в этом формате требуется значительная работа по разработке данных.

Генеративные модели искусственного интеллекта не очень хороши для получения необработанных табличных данных из разных источников и превращать их в плоский, двумерный формат, необходимый для прогнозного моделирования. Это навык, который обычно требует опытного ученых данных.

По словам Бронфмана, использования векторной базы данных также недостаточно для полноценного прогнозирующего моделирования ИИ.

Он объяснил, что, хотя векторные базы данных и встраивания могут поддерживать базовые прогнозирующие возможности, работая с ограниченным набором функций, их недостаточно.

Бронфман сказал, что либо модели должны быть очень простыми, снимая только ограниченную картину, либо альтернативно ученому по данным все равно потребуется сделать относительно сложную инженерию функций, чтобы подготовить данные в надлежащем формате, прежде чем питать их более богатой прогнозной модели.

Инновации в подготовке данных помогают улучшить прогноз

В то время как разговорной прогнозирующий Gen AI может быть наиболее заметной новой способностью, Pecan AI продвигается вперед со своими запатентованными инновациями в отношении автоматизации подготовки данных и инженерии функций.

Среди инноваций для подготовки данных, над которыми работал Pecan AI, является автоматизация, чтобы помочь улучшить такие проблемы, как утечка данных, которые могут подорвать точность модели. В машинном обучении утечка данных относится к использованию информации, взятой из процесса обучения, которая обычно не будет доступна, когда будет сделан прогноз.

«НЕ ТРИВИЛЬНО в выявлении утечки, особенно если вы не профессиональный ученый», — сказал Бронфман. «Так что у нас есть, например, автоматизированные способы определения утечки».

Источник