Капуста в жире
Капуста в жире личный блог
15 мая 2026, 11:09

Появился убийца NVIDIA 😱

ЧИП, КОТОРЫЙ ОТКАЗАЛСЯ БЫТЬ МАЛЕНЬКИМ
Появился убийца NVIDIA 😱

В 1984 году IBM приняла решение, которое казалось абсолютно рациональным в то время.

Они создавали персональный компьютер и нуждались в чипе.

Появился убийца NVIDIA 😱

Вместо того чтобы производить свой собственный, они лицензировали его у маленькой калифорнийской компании под названием Intel.

Просто, дёшево, быстро. Что могло пойти не так? Оказалось, что всё.

В течение следующих двух десятилетий Intel стала самой важной компанией в сфере вычислений, а решение IBM передать мозг собственного продукта на аутсорсинг стало самым дорогим «коротким путём» в истории бизнеса.

У полупроводниковой индустрии долгая и славная традиция: люди отказываются следовать общепринятой мудрости. И примерно раз в десятилетие один из таких отказов превращается в рыночный сдвиг на триллион долларов.

Возможно, мы наблюдаем такой сдвиг прямо сейчас.

Компания под названием Cerebras Systems выходит на Nasdaq под тикером CBRS.

IPO было переподписано в 20 раз, а ценовой диапазон уже дважды повышали.

И эта сделка вызвала такой институциональный ажиотаж, что управляющие портфелями отменяют свои игры в гольф.

Но настоящая инсайдерская идея Cerebras Systems заключается не в создании более быстрого чипа, а в том, чтобы вообще отказаться от нарезки кремниевой пластины.

Самая очевидная идея, которую никто не пробовал

Процесс производства полупроводников оставался практически неизменным на протяжении 60 лет.

Вы берёте кремниевую пластину размером примерно с обеденную тарелку, на которой с помощью света размещены сотни крошечных чипов, а затем нарезаете её, как пиццу.

Каждый чип используется в телефоне, сервере или видеокарте.

И каждая чиповая компания на земле делает это ровно так (и Nvidia, и AMD, и Intel).

Один инженер Cerebras посмотрел на этот процесс и придумал идею настолько простую, что она почти раздражает.

А что, если просто не нарезать её?

Результат — Wafer-Scale Engine (WSE), и это, без преувеличения, самый большой чип из когда-либо созданных.

Речь идёт о 46 225 мм² против 814 мм² у Nvidia H100 — это в 56 раз больше, чем самый мощный GPU на планете.

Появился убийца NVIDIA 😱 Причина, по которой это важно, сводится к одному слову: пропускная способность.

Каждый раз, когда ИИ-модель генерирует слово, ей нужно обратиться к памяти, взять оттуда набор чисел, называемых весами, перемножить их и выдать предсказание.

Проделайте это тысячу раз в секунду на каждого пользователя, с учётом миллионов одновременных сессий — и узким местом становится не вычислительная мощность, а то, насколько быстро чип может перемещать данные из памяти в процессор.

NVIDIA H100 перемещает данные примерно со скоростью 3 терабайта в секунду. В то время как WSE-3 перемещает данные со скоростью 21 петабайт в секунду — примерно в 7000 раз быстрее.

Появился убийца NVIDIA 😱 Причина проста: когда память и вычисления живут на одном огромном чипе, данным почти не нужно никуда перемещаться.

Одно из самых больших узких мест в современном ИИ — это «стена памяти», когда модели постоянно перегоняют данные туда-сюда между памятью и процессорами, создавая задержки и неэффективность.

Cerebras Systems уменьшает эту проблему, удерживая всё на одном чипе размером с пластину, что становится невероятно ценным в эру инференса, когда миллионы ИИ-запросов обрабатываются нон-стоп.

Почему время имеет решающее значение

Последние четыре года индустрия ИИ была одержима обучением (тренировкой).

Обучение моделей, которое стоит $100 млн и занимает шесть месяцев на десяти тысячах GPU.

Это игра, в которой Nvidia полностью доминировала и будет продолжать доминировать в обозримом будущем.

Но кое-что меняется.

OpenAI уже обучила GPT-5, Google — Gemini Ultra, а Meta — Llama 4.

Фаза создания максимально большого мозга в основном завершена. Далее следует инференс.

Каждый запрос к ChatGPT, каждый обобщённый документ и каждая задача ИИ-агента работают на инференсе — круглосуточной нагрузке, питающей современную ИИ-экономику.

Рынок инференса, по прогнозам, вырастет с $106 млрд в 2025 году до $255 млрд к 2030 году. Вот где сейчас вся игра.

Это момент, к которому Cerebras строилась, и они вышли к IPO как раз тогда, когда центр тяжести индустрии движется в их сторону.

Почему акции производителей памяти взлетают?

Вот что сейчас скрывается на виду.

Пока все спорили об IPO Cerebras, на рынке чипов памяти вспыхнул сигнал.

Micron (MU) только что отчиталась о сильнейшей прибыли за последние годы, а SK Hynix устанавливает рекордные максимумы на волне спроса на HBM3E.

Стандартный нарратив заключается в том, что это чисто история про Nvidia: больше выпущенных GPU — больше требуется высокопропускной памяти.

Это правда, но есть и второй вывод, о котором почти никто не пишет.

Когда цены на память растут, это не только приносит пользу компаниям, продающим память, но и делает аргументы в пользу альтернатив архитектурам с интенсивным использованием памяти гораздо более убедительными.

NVIDIA H100 использует 80 ГБ памяти HBM3 — дорогой, энергозатратной и всё более дефицитной.

Каждый сервер, который вы строите на H100, — это сервер, который вы заполняете самым дефицитным компонентом в цепочке поставок ИИ.

WSE-3 от Cerebras вообще не использует HBM. Вместо этого у него есть 44 ГБ встроенной SRAM (статической памяти с произвольным доступом), напрямую впаянной в пластину.

У него нет внешних стеков памяти, нет зависимости от цепочки поставок HBM3 и нет риска колебания цен SK Hynix или Micron, который бьёт по вашим затратам на дата-центры каждый квартал.

Таким образом, когда MU и SK Hynix растут, одновременно происходят две вещи.

Инфраструктура на базе NVIDIA становится дороже в строительстве и эксплуатации, а аргументы в пользу Cerebras — чипа, который полностью обходит эти затраты, становится всё легче приводить каждому финансовому директору в комнате.

Подумайте об этом с точки зрения гиперскейлера.

Вы — Amazon, Microsoft или Google, и вы пытаетесь нарастить мощности для инференса в масштабе.

Каждый квартал затраты на ваш GPU-кластер растут не только потому, что Nvidia повышает цены, но и потому, что память HBM внутри каждого сервера тоже становится дороже.

А данные по ценам на память начинают выглядеть параболически, даже после того как они росли уже более шести месяцев подряд.

Цены на экспорт южнокорейской DRAM недавно подскочили ещё на 35%, цены на флеш-память взлетели на 47%, а цены на SSD выросли почти на 140% всего за несколько недель.

Это именно тот тип инфляции в цепочке поставок, который гиперскейлеры ненавидят лицезреть, когда планируют многомиллиардные бюджеты на ИИ-инфраструктуру.

Появился убийца NVIDIA 😱

Последние прогнозы Micron указывают на то, что цены на HBM могут оставаться повышенными как минимум до 2026 года и даже до 2027 года.

Это ценовое давление как раз и подталкивает закупочные команды к тому, чтобы начать рассматривать альтернативы.

Не как замену всему, что они уже построили на CUDA, а как выделенный слой для инференса, где экономика выглядит более разумно.

AWS это уже поняло: их развёртывание Bedrock на Cerebras — это не научный эксперимент, а хедж против того, как цикл ценообразования HBM бьёт по их маржинальности инференса.

Для инвесторов, наблюдающих за торгами CBRS в первый день, это макро-настройка, которая не отражена в S-1, но абсолютно точно проявляется в портфеле заказов.

Растущий прилив памяти поднимает не все лодки одинаково, но иногда он заставляет людей очень серьёзно посмотреть на лодку, которой вода вообще не нужна.

А теперь — место, где мы перестаём восхищаться и начинаем быть честными

Отбросьте инженерное чудо и бешеную переподписку — и всплывает несколько вещей.

86% выручки за 2025 год поступило от двух организаций, связанных с ОАЭ, в то время как выручка в США упала на 34% — до $187 млн.

А сделка с OpenAI на $20 млрд по инфраструктуре вычислений, хотя и трансформационная, всё ещё является условным контрактом.

Если Cerebras пропустит ключевые вехи поставок, OpenAI может расторгнуть соглашение, что также может повлечь требования о возврате средств, связанные с кредитной линией компании на $1 млрд.

Другими словами, самый большой драйвер роста Cerebras является также одним из её самых больших финансовых рисков.

Структура управления тоже сложная.

Сэм Альтман одновременно является личным инвестором Cerebras, генеральным директором её крупнейшего клиента и связан с компанией как кредитор через финансовое соглашение с OpenAI.

Во время судебного процесса OpenAI против Илона Маска соучредителей обвиняли в том, что они не полностью раскрыли эти личные инвестиции, когда принимались закупочные решения.

Ничего из этого не было признано незаконным, но это именно та структура отношений, которая заставляет институциональных инвесторов и комплаенс-команды нервничать.

И тем не менее, несмотря на все эти риски, рынок по-прежнему оценивает Cerebras Systems примерно в 91x от выручки за последние 12 месяцев. Это значительно дороже, чем у таких игроков, как Nvidia, AMD и даже Arm Holdings.

Так на что же именно ставят инвесторы?

OpenAI запускает рабочие нагрузки на оборудовании Cerebras не потому, что Эндрю Фельдман (генеральный директор Cerebras) отправил Сэму Альтману милую праздничную открытку.

Они делают это, потому что скорость инференса имеет значение, а прыжок с примерно 150 токенов в секунду до 2000 токенов в секунду — это разрыв, который делает агентный ИИ реально работающим в реальном времени.

Amazon Web Services интегрировала Cerebras в Bedrock по той же причине.

Их дезагрегированная (раздельная) архитектура инференса, по сообщениям, обеспечивает примерно в 5 раз большую пропускную способность в том же физическом пространстве.

А это напрямую влияет на экономику дата-центров, энергопотребление и эффективность инфраструктуры.

А затем есть ещё портфель заказов.

Cerebras завершил 2025 год с примерно $24,6 млрд неисполненных договорных обязательств.

Для компании с годовой выручкой чуть более $500 млн это огромная цифра, что означает: у компании теоретически уже законтрактованы годы роста.

Спрос есть, контракты подписаны, и теперь Cerebras остаётся лишь доказать, что она может поставлять оборудование в масштабе.

Честный вердикт

Cerebras — это реальная технологическая компания, решающая реальную проблему именно в тот момент цикла ИИ, когда это нужно больше всего.

Список клиентов, портфель заказов и архитектурное преимущество — всё это подлинно.

Взлёт в первый день? Почти неизбежен. Скорее всего, акции взлетят до 200-х.

Трёхлетний тезис? Это ставка на то, удастся ли конвертировать $24.6 млрд портфеля заказов в диверсифицированную выручку до того, как рынок начнёт задавать более жёсткие вопросы о финансовых показателях.

Высокая уверенность для верующих в суперцикл инференса. Для всех остальных — многовато для проглатывания.


P.S. А пока американский рынок доступен не для всех, мы активно торгуем российский рынок на ежедневной основе. Присоединяйся к капустному сообществу Капуста в жире 🥬  

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
14 Комментариев
  • Михаил Беляев
    15 мая 2026, 11:23
    амеровский рынок хорошо но есть еще китай и тайвань и они тоже в гонке.
  • Маркиз Лафайет
    15 мая 2026, 11:37
    Присмотрюсь, может куплю
  • MONETA invest
    15 мая 2026, 11:51
    Небольшой технологический нюанс. Когда на пластине 30 чипов, из них 10-20-50% уйдут в брак, остальные можно использовать.Если на пластине один большой чип, то при малейшем отклонении от норм, вся пластина уйдет в брак. Стоимость будет значительно выше обычных чипов.
    Но если это окупится, то это может быть очередной прорыв в области оборудования для ии.
  • AVIM
    15 мая 2026, 12:19
    Да неужели кто то проглотит этот маркетинг...
    60 лет не догадывались и вдруг осенило
    без тех подробностей… сразу налетели на ляп.....

    Цены на экспорт южнокорейской DRAM недавно подскочили ещё на 35%, цены на флеш-память взлетели на 47%, а цены на SSD выросли почти на 140% всего за несколько недель.

    или это просто замена идеи квантового процессора?

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн