Позитрон считает, что он нашел секрет, чтобы взять на себя NVIDIA в фишках по выводу искусственного интеллекта — вот как это может принести пользу предприятиям — Новости искусственного интеллекта и технологий

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

В качестве спроса на крупномасштабные скирокиты по развертыванию ИИ, менее известные, Private Chip Startup Positron позиционирует себя как прямой претендент на лидера рынка Nvidia Предлагая выделенные, энергоэффективные, оптимизированные память микросхемы с выводом, направленные на освобождение затрат на монтаж отрасли, мощность и узкие места доступности.

«Ключевым отличием является наша способность управлять моделями Frontier AI с лучшей эффективностью-превышение производительности от 2 раза до 5x за ватт и доллар по сравнению с Nvidia»,-сказал Томас Сохмер, соучредитель позитрона и технический директор В недавнем интервью видео по вызову с VentureBeat.

Очевидно, что это хорошая новость для больших поставщиков моделей ИИ, но руководство Позитрона утверждает, что это полезно для многих других предприятий, включая тех, кто использует модели ИИ в своих рабочих процессах, а не как предложения услуг для клиентов.

«Мы строим чипы, которые можно развернуть в сотнях существующих центров обработки данных, потому что они не требуют жидкого охлаждения или экстремальной плотности мощности», — указал Митеш Агравал, генеральный директор Позитрона и бывший главный операционный директор поставщика выводов AI Cloud Lambdaтакже в одном и том же интервью видеозвонков с VentureBeat.

Венчурные капиталисты и ранние пользователи, кажется, согласны.

Позитрон вчера объявил о переподписанном раунде финансирования в размере 51,6 млн. Долл. США Во главе с Valor Equity Partners, Atreides Management и DFJ Growth, при поддержке Flume Ventures, Reservience Reserve, Fund 1517 и если.

Что касается ранней клиентской базы Позитрона, это включает в себя как предприятия по имени, так и компании, работающие в секторах, работающих на выводе. Подтвержденные развертывания включают в себя крупный поставщик сети по обеспечению безопасности и облачного контента Cloudflareкоторый использует аппаратное обеспечение Positron’s Atlas в своих глобально распределенных центрах обработки данных, и Парасейлчерез AI-инфраструктурную платформу с AI-инфраструктурой.

Помимо этого, Позитрон сообщает о принятии в нескольких ключевых вертикалях, где эффективный вывод имеет решающее значение, например, как Сеть, игры, модерация контента, сети доставки контента (CDN) и поставщики токена как услугиПолем

Эти ранние пользователи, как сообщается, привлекают способность Атласа обеспечивать высокую пропускную способность и снижение энергопотребления, не требуя специализированного охлаждения или переработанной инфраструктуры, что делает его привлекательным вариантом для работы с искусственным интеллектом в области корпоративных сред.

Вывод сложного рынка, который уменьшает размер модели ИИ и повышает эффективность

Но Позитрон также выходит на сложный рынок. Информация только что сообщил, что rIval Buzzy Ai Soinceper Startup Startup Groq — где Sohmers ранее работал директором по технологической стратегии — сократил свой прогноз доходов на 2025 год с 2 миллиардов долларов+ до 500 миллионов долларов, подчеркнув, насколько изменчивым может быть аппаратное пространство AI.

Даже хорошо финансируемые фирмы сталкиваются с опорным ветром, поскольку они конкурируют за способность центра обработки данных и предприятия MindShare против укоренившихся поставщиков графических процессоров, таких как Nvidia, не говоря уже о слоне в комнате: рост более эффективных, более мелких крупных языковых моделей (LLM) и специализированных малых языковых моделей (SLM), которые могут работать даже на маленьких и низкопроизводных моделях, как смартфоны.

Тем не менее, руководство Позитрона сейчас охватывает эту тенденцию и отбросит возможное влияние на ее траекторию роста.

«Всегда существовало эта двойственность — легкие приложения на местных устройствах и тяжелая обработка в централизованной инфраструктуре», — сказал Агравал. «Мы считаем, что оба будут расти».

Сохмер согласился, заявив: «Мы видим будущее, где у каждого человека может быть способная модель на своем телефоне, но они все равно будут полагаться на большие модели в центрах обработки данных, чтобы генерировать более глубокое понимание».

Атлас-это фиш

В то время как графические процессоры Nvidia помогли катализировать глубокий учебный бум, ускоряя тренировку модели, Позитрон утверждает, что вывод — этап, на которой модели генерируют производство в производстве — теперь является истинным узкимл.

Его основатели называют его наиболее недоопти ароматизированной частью «стека ИИ», особенно для генеративных рабочих нагрузок ИИ, которые зависят от быстрой и эффективной модельной службы.

Решение Позитрона Atlas, его ускоритель вывода первого поколения, построенный специально для обработки больших моделей трансформаторов.

В отличие от графических процессоров общего назначения, Atlas оптимизирован для уникальной памяти и потребностей в пропускной способности современных задач вывода.

Компания утверждает, что Atlas обеспечивает 3,5x лучшую производительность за доллар и до 66% более низкого использования мощности, чем H100 NVIDIA, а также достигает 93% использования пропускной способности памяти — на превышении типичного диапазона 10–30%, наблюдаемого в графических процессорах.

От атласа до Титана, поддержка моделей с несколькими триллионами параметров

Запущенный всего через 15 месяцев после основания — и всего 12,5 млн. Долл. США в семье — Atlas уже отправляется и находится в производстве.

Система поддерживает модели до 0,5 триллионов параметра на одном 2-километровом сервере и совместима с моделями обнимающих трансформаторов лица через совместимую конечную точку API OpenAI.

В настоящее время Positron готовится запустить свою платформу следующего поколения Titan, в 2026 году.

Построен на индивидуальном кремнии «Асимова», Титан будет иметь до двух терабайт высокоскоростной памяти на ускоритель и модели поддержки до 16 триллионов параметровПолем

Сегодняшние пограничные модели находятся в сотнях миллиардов и однозначных триллионов параметров, но, как считается, новые модели, такие как GPT-5 Openai, находятся в много триллионов, и в настоящее время считается, что более крупные модели требуются для достижения искусственного общего интеллекта (AGI), AI, который превосходит человеческие люди на наиболее экономически ценных работах и суперинтигенции, которые расширяют способность к людям, которые понимают, что они могут понять, что они понимают, что они понимают, что они понимают.

Важно отметить, что Titan предназначен для работы со стандартным воздушным охлаждением в обычных средах центра обработки данных, избегая конфигураций с жидко-охлаждением, которые все чаще требуют графических процессоров следующего поколения.

Техника для эффективности и совместимости

С самого начала Positron разработал свою систему для замены падения, позволяя клиентам использовать существующие модельные двоичные файлы без перезаписывания кода.

«Если клиент должен был изменить свое поведение или свои действия каким -либо образом, формы или формы, это был барьер», — сказал Сохмерс.

Sohmers объяснил, что вместо создания сложного стека компиляторов или разрабатывания программных экосистем, сфокусированы на сфокусировании на вывод, проектируя аппаратное обеспечение, которое напрямую проглатывает модели, обученные NVIDIA.

«Режим CUDA — это не то, чем сражаться», — сказал Агравал. «Это экосистема для участия».

Этот прагматический подход помог компании быстро отправить свой первый продукт, проверить производительность с реальными предприятиями и обеспечить значительные последующие инвестиции. Кроме того, его сосредоточение на воздушном охлаждении по сравнению с жидким охлаждением делает свои чипсы атласа единственным вариантом для некоторых развертываний.

«Мы сосредоточены исключительно на чисто развертываниях с воздушным охлаждением… все эти решения Nvidia Bopper и Blackwell в будущем требуются… Единственное место, где вы можете поместить эти стойки, находится в центрах обработки данных, которые недавно построены сейчас в глуши », — сказал Сохмерс.

В общем, способность Позитрона быстро и эффективно выполнять капитал помогла различить его на многолюдном рынке аппаратных средств искусственного интеллекта.

Память — это то, что вам нужно

Sohmers и Agrawal указывают на фундаментальный сдвиг в рабочих нагрузках искусственного интеллекта: от разбирающихся сверточных нейронных сетей к архитектурам трансформаторов, связанных с памятью.

Принимая во внимание, что более старые модели требовали высоких провалов (операции с плавающей точкой), современным трансформаторам требуется массивная способность памяти и пропускную способность для эффективной работы.

В то время как NVIDIA и другие продолжают сосредотачиваться на вычислительном масштабировании, Позитрон делает ставки на дизайн первой памяти.

Sohmers отметил, что с выводом трансформатора соотношение вычислительных операций к памяти переводится к почти 1: 1, что означает, что повышение использования памяти оказывает прямое и драматическое влияние на производительность и эффективность питания.

Поскольку Атлас уже превосходит современные графические процессоры по ключевым показателям эффективности, Титан стремится сделать это дальше, предлагая максимальную способность памяти на чип в отрасли.

При запуске, как ожидается, Titan предложит увеличение порядка матчей по сравнению с типичными конфигурациями памяти графических процессоров-без требования специализированного охлаждения или настройки бутик-сети.

Построенные в США чипсы

Производство Positron с гордостью является домашним. Чипы первого поколения компании были изготовлены в США с использованием средств Intel, с окончательной сборкой и интеграцией сервера также основаны на внутреннем месте.

Для чипа AsiMov изготовление перейдет на TSMC, хотя команда стремится сохранить как можно большую часть остальной части производственной цепочки в США, в зависимости от пропускной способности литейного завода.

Геополитическая устойчивость и стабильность цепочки поставок становятся ключевыми критериями закупок для многих клиентов-другая причина, по которой Позитрон считает, что его оборудование, созданное в США, предлагает убедительную альтернативу.

Что дальше?

Агравал отметил, что кремниевые нацеливания Позитрона не только широкая совместимость, но и максимальная полезность как для предприятий, облаков и исследовательских лабораторий.

В то время как компания еще не назвала никаких поставщиков пограничных моделей в качестве клиентов, он подтвердил, что проживание и разговоры продолжаются.

Agrawal подчеркнул, что продажа физической инфраструктуры, основанной на экономике и производительности, а не объединяет ее с проприетарными API или бизнес -моделями — является частью того, что дает позитрон доверие на скептическом рынке.

«Если вы не можете убедить клиента развернуть ваше оборудование в зависимости от его экономики, вы не будете прибыльными», — сказал он.

Источник

Позитрон считает, что он нашел секрет, чтобы взять на себя NVIDIA в фишках по выводу искусственного интеллекта — вот как это может принести пользу предприятиям

Вывод сложного рынка, который уменьшает размер модели ИИ и повышает эффективность

Атлас-это фиш

От атласа до Титана, поддержка моделей с несколькими триллионами параметров

Техника для эффективности и совместимости

Память — это то, что вам нужно

Построенные в США чипсы

Что дальше?

Данные переполнения стека показывают скрытый налог на производительность «почти правильного» кода ИИ

Nightfall запускает «NYX», ИИ, который автоматизирует предотвращение потери данных в масштабе предприятия

Рекомендуем

Оставить комментарий Отменить ответ