Запуск запуска Embed V3 для Enterprise LLM -приложений

Присоединяйтесь к событию, которым доверяют лидеры предприятия в течение почти двух десятилетий. VB Transform объединяет людей, строящих реальную стратегию ИИ предприятия. Узнать больше

На основе Toronto Startup Cohere запустила Enced V3, последнюю итерацию модели встраивания, предназначенную для семантического поиска и приложений, использующих большие языковые модели (LLMS).

Модели встраивания, которые преобразуют данные в численные представления, также называемые «встраиваемыми», привлекли значительное внимание благодаря росту LLMS и их потенциальных вариантов использования для предприятий.

Embed V3 конкурирует с ADA OpenAI и различными опциями с открытым исходным кодом, обещающими превосходную производительность и улучшенное сжатие данных. Это продвижение направлено на сокращение эксплуатационных затрат на предприятия приложений LLM.

Встраиваемые и тряпичные

Встраиваемые встраивания играют ключевую роль в различных задачах, в том числе в поисках, дополненном поколении (RAG), ключевом применении крупных языковых моделей в предпринимательском секторе.

RAG позволяет разработчикам предоставлять контекст LLMS во время выполнения, извлекая информацию из таких источников, как руководства пользователя, история электронной почты и чата, статьи или другие документы, которые не были частью оригинальных данных обучения модели.

Чтобы выполнить тряпку, компании должны сначала создать встроенные в свои документы и хранить их в векторной базе данных. Каждый раз, когда пользователь запрашивает модель, система ИИ вычисляет встраивание подсказки и сравнивает ее с вставками, хранящимися в векторной базе данных. Затем он получает документы, которые наиболее похожи на подсказку, и добавляет содержание этих документов к языку быстрого приглашения пользователя, предоставляя LLM необходимый контекст.

Решение новых проблем для AI Enterprise

RAG может помочь решить некоторые проблемы LLM, включая отсутствие доступа к актуальной информации и генерацию ложной информации, иногда называемой «галлюцинациями».

Однако, как и в случае с другими системами поиска, значительная проблема RAG состоит в том, чтобы найти документы, которые наиболее актуальны для запроса пользователя.

Предыдущие модели встраивания боролись с шумными наборами данных, где некоторые документы, возможно, не были правильно заполнены или не содержат полезной информации. Например, если пользователь запросит «симптомы Covid-19», более старые модели могут оценить менее информативный документ выше просто потому, что он включает термин «Covid-19 имеет много симптомов».

С другой стороны, Cohere Embed V3 демонстрирует превосходную производительность в соответствующих документах для запросов, предоставляя более точную семантическую информацию о содержании документа.

В примере «Симптомы Covid-19» в Entud V3 будет ранжировать документ, обсуждающий конкретные симптомы, такие как «высокая температура», «непрерывный кашель», «потеря запаха или вкус», выше, чем документ, просто утверждая, что у Covid-19 есть много симптомов.

Согласно Cohuer, Enced V3 превосходит другие модели, в том числе ADA-002 Openai, в стандартных тестах, используемых для оценки производительности моделей встраивания.

Embed V3 доступен в разных размерах встраивания и включает в себя многоязычную версию, способную соответствовать запросам с документами на разных языках. Например, он может найти французские документы, которые соответствуют английскому запросу. Более того, Entered V3 может быть настроен для различных приложений, таких как поиск, классификация и кластеризация.

Продвинутая тряпка

Согласно COUER, Embed V3 продемонстрировал превосходную производительность в сфере расширенного использования, в том числе многопроблемные запросы RAG. Когда подсказка пользователя содержит несколько запросов, модель должна идентифицировать эти запросы отдельно и получить соответствующие документы для каждого из них.

Обычно это требует нескольких этапов анализа и поиска. Способность встраивать V3 предоставлять более качественные результаты в пределах 10 полученных документов снижает необходимость внесения нескольких запросов в векторную базу данных.

В Enced V3 также улучшается реэнергирование, функцию, добавленную в его API несколько месяцев назад. Реанкинг позволяет поисковым приложениям сортировать существующие результаты поиска на основе семантических сходств.

«Rerank особенно сильна для запросов и документов, которые касаются нескольких аспектов, что -то, с чем борются модели из -за их дизайна», — сказал представитель Cohere Cohere. «Тем не менее, Rerank требует, чтобы первоначальный набор документов передавался в качестве входного.

Более того, Embed V3 может помочь снизить затраты на запуск векторных баз данных. Модель прошла трехэтапный тренировочный процесс, в том числе специальный метод обучения с ограничением сжатия. «Основным фактором затрат, часто в 10x-100x выше, чем вычисление встраиваний, является стоимость векторной базы данных»,-сказал представитель. «Здесь мы выполнили специальное обучение с ограничением сжатия, которое делает модели подходящими для сжатия вектора».

Согласно блогу COHERE, эта стадия сжатия гарантирует, что модели хорошо работают с методами сжатия вектора. Эта совместимость значительно снижает затраты на векторную базу данных, потенциально благодаря нескольким факторам, сохраняя при этом качество поиска до 99,99%.

Источник

Встраиваемые и тряпичные

Решение новых проблем для AI Enterprise

Продвинутая тряпка

«Джонни Мнемоник» с точки зрения кибербезопасности

Искусственный интеллект: от фантастической идеи к повседневной реальности

Рекомендуем

Оставить комментарий Отменить ответ