Noname Research
Noname Research личный блог
Вчера в 12:16

Суверенное ИИ в РФ невозможно

#AI #datacenters #YDEX #SBER

t.me/zzz_NonameResearch

Со стороны компаний часто можно увидеть информационные вбросы по поводу того что по каким-то бенчмаркам Гигачат Сбера или Алиса AI Яндекса обошли какие-то китайские LLM модели. Главы компаний на различных отраслевых мероприятиях говорят о том, что они находятся на острие технологического прогресса в сфере ИИ.

В этом посте я хочу объяснить почему это все попросту не может быть правдой и не будет правдой в ближайшие 5 лет как минимум, да и в целом наверное никогда. 

_______________

Сначала давайте убедимся в том, что Российские модели сильно отстают от передовых моделей США и Китая

В таблице ниже приведено сравнение передовых (фронтирных/frontier) моделей от текущих глобальных лидеров в этом напарвлении (Anthropic с моделью Claude, Open AI с моделью Chat GPT и Google c моделью Gemini), от китайских лидеров (Alibaba c Qwen и DeepSeek) c нашими моделями от Яндекса и Сбера.

Суверенное ИИ в РФ невозможно

Сразу следует отметить, что по российским моделям тяжело собрать сопоставимые данные. Российские модели объективно отстают на поколение-полтора, и их собственные бенчмарки несопоставимы с международными (тестировались против GPT-4o/Qwen-2.5, а не текущих флагманов) поэтому сравнение получается неполным.

Дам вам еще немного контекста по поводу Российских LLM

Суверенное ИИ в РФ невозможно

З
десь также очень важно отметить, что модели Alice AI ВСЕГДА являются дообученными под русский язык, контекст и клиентские данные клиентов Яндекса открытыми (open-source) моделями от Qwen (Alibaba), а модели Gigachat всегда являются дообученными под русский язык, контекст и клиентские данные клиентов Сбера открытыми моделями от DeepSeek.

То есть и Яндекс и Сбер пропускают самый затратный (и по количеству часов вычислений и по количеству необходимых чипов и по количеству необходимых денег и специалистов) этап создания LLM-моделей — training phase. На этом этапе методом подбора формируются модельные веса для всех параметров (нейронов) модели (например в последнем DeepSeek сейчас 1.6 трлн. параметров). В этот момент сотни тысяч GPU/ASIC чипов работают как единое целое в нескольких передовых кластеров ЦОДов, тратятся Тераватты энергии. А чтобы вообще сделать возможным синхронную работу нескольких сотен тысяч чипов — тратятся десятки миллиардов долларов на создание передовых инженерных и инфрастурктурных систем внутри ЦОД, передовых вычислительных чипов (GPU/ASIC), чипов памяти (HBM, DRAM, SSD), оптических соединений типа scale-up, scale-out и scale-across и т.д. и т.п.

Это означает, что модели Яндекса и Сбера каждый год конечно становятся лучше, но они становятся лучше только потому что выходят новые модели от Qwen и DeepSeek. Qwen и DeepSeek пока что каждую модель которую выпускают — выпускают в формате open-source. Это означает, что любая организация может скачать огромный исходный файл с подобранными (на этапе training) весами для нейронов внутри модели, развернуть эту модель на своих локальных серверах и сказать что типа вот у нас есть своя LLM, она работает. 

DeepSeek и Qwen пока что так делают, потому что создают ценовую конкуренцию для фронтирных моделей США. Я писал отдельный пост, почему фронтирные модели США на самом деле существенно лучше несмотря на близость оценок по различным бенчмаркам, и почему Китайцы тоже пока их не могут догнать и не смогут в ближайшее время (спойлер — из-за оборудования и чипов). Если вам интересно, то можете ознакомиться тут t.me/zzz_NonameResearch/2300

Но на самом деле это уже не сильно работает и это заметно по темпу ускорения ARR (annual run-rate — прогнозная выручки на 12М исходя из перемножения текущей месячной выручки на 12) у компании Anthropic которая в феврале 2026 г. выпустила сенсационную модель Claude Opus 4.6, которая позволила существенно расширить сферы применения ИИ (вплоть до того что оно теперь само может рисовать презентации и делать финансовые модели).

Суверенное ИИ в РФ невозможно
То есть несмотря на то, что по бенчмаркам последний DeepSeek v4 несильно отстает от Claude — на практике эти бенчмарки не учитывают несколько компонентов модели, которые позволяют выполнять сложные комплексные и длинные задачи или не позволяют, а также эти бенчмарки не полностью учитывают то на каких чипах работают эти LLM — а чипы США значительно превосходят Китайские чипы.

Суверенное ИИ в РФ невозможно
К
 чему я это все? К тому что, в скором времени мы можем увидеть, что Китайские компании перестанут выкладывать модели в Open-source потому что поймут, что свою выручку они теряют, а компаниям из США при этом особо не мешают. 

На самом деле мы уже это видим. Alibaba перестала давать открытый доступ к своим самым передовым моделям. Остальные компании могут пойти по этому же пути.

Суверенное ИИ в РФ невозможно

К такому решению на самом деле приводит не только тот факт, что компаниям из США open-source подход Китайцев не смог помешать. Это также связано в целом с активным ростом потребления китайских LLM населением как Китая так и других стран. То есть разрбаотчики LLM сжигают миллиарды долларов на обеспечение inference своих LLM и ничего не получают. Inference значительно вырос, соотвественно есть спрос, а если есть спрос — значит надо собирать деньги и это абсолютно логично.  

Суверенное ИИ в РФ невозможно

То есть теперь, по мере того как Китайцы начнут закрывать доступ к своим передовым моделям — организации не смогут выкачать их веса и поставить к себе модель на локальные серверы и говорить что это их модель. Им придется тратить кучу денег на покупку доступа к этим моделям через API. Ни Сбер, ни Яндекс не имели положительного FCF от разработки «своих»  LLM — как и ни одна компания в мире пока что. А теперь их FCF станет еще хуже, если они захотят продолжать показывать, что «их» LLM становятся умнее — им просто придется теперь покупать доступ к новым LLM.

Тут есть конечно другой выход — ждать полгода-год пока Китайцы не выпустят модели еще лучше предыдущих платных и тогда сделают новые модели платными а старые бесплатными — и тогда Сбер и Яндекс скачают эти модели на свои сервера и скажут что типа ребята смотрите мы пипец как продвинулись. 

Но тогда это будет означать, что мы всегда на год позади Китайских моделей, а вообще по сути мы на десятки лет позади, потому что у нас нету достаточных мощностей ЦОД чтобы сделать training. А китайские модели в свою очередь всегда на 1-1.5 позади Американских моделей

При этом если Китайцы вообще перестанут выкладывать модели в Open-Source — то:

1) Либо FCF Яндекса и Сбера существенно ухудшится

2) Либо они перестанут улучшать свои LLM и люди просто со временем перестанут ими пользоваться, потому что они ничего не могут по сравнению с тем что есть в мире. Я сейчас не говорю о гуглинге с помощью Алисы конечно — это как продолжение браузера

3) Либо они скажут, что закрывают эту лавочку и Российское ИИ невозможно — посмотрят правде в глаза

Закончить еще хочу Графиком и таблицей, в которых видны CAPEX на ЦОДы Китайцев и США. На эти таблицы необходимо смотреть, зная что Яндекс и Сбер тратят на развитие ИИ (закупку GPU от Nvidia через третьи страны и строительство ЦОДов которые могут выдерживать LLM-inference нагрузки) сотни миллиардов рублей. Если конкретнее, то:

Яндекс тратит примерно 150-200 млрд рублей (2-2.5 млрд долл.) 

Сбер тратит в 2 раза больше — 300-400 млрд руб. (4-5 млрд долл.)

А теперь смотрим на затраты в долл. у Мировых и Китайских лидеров

Суверенное ИИ в РФ невозможно

Думаю, это очень показательно для того чтобы закончить данный пост тезисом — «Суверенное ИИ в РФ невозможно, мы либо будем покупать технологии Китая либо технологии США»

 

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
33 Комментария
  • Да не парься. Можно поднять и раскрутить свои технологии. За тридцать лет. И ты заплатишь за это из своего кармана.
    • alvas
      Вчера в 15:07
      Дмитрий-Димас Ермаков, за 30 лет представляешь на каком уровне будут технологии китайцев и США? это как телега и космический корабль
      • alvas, надо не догонять, надо решать проблемы. Свои реальные и текущие проблемы. Пускай бегут. Пускай ускоряются. Разведка достанет все эти секреты. Назначение управления оптимизировать деятельность и работу. Производство и сбыт. Науки и технологии. Связать науку, промышленность и торговлю. Клиента и инженера. Бизнес и население. Вот смысл управления.
        И то, чем занимается сейчас Запад — это не наука и не технологическое развитие. Это они так готовятся к апокалипсису. И создают ИИ как инструмент и оружие в борьбе за мировые ресурсы. Ты сейчас внутри картинки, которую нарисовали банкиры. И это не реальность, это картинка маркетологов. Тебе надо смотреть на мир строго научно. США и ЕС перед кризисом и катастрофой. Вот почему всё это, что ты читаешь в новостях. У них будет борьба с Китаем.
        • alvas
          Вчера в 16:37
          Дмитрий-Димас Ермаков, что ты такое несешь??? ИИ это прорыв в технологиях, который реально дает кучу преимуществ в других сферах, электронику и кучу еще чего успешно прокакали и запрагнуть в уходящий поезд не получится, тут хотя бы не упуска ли бы… но нет, даже не понимаете как это все опасно
  • да
    вы правы 
    нам остается закрыть свой интернет и закапсулироваться 
    амеры и китай чешут мировой спрос и могут позволить себе миллиарды тратить и получать с этого свой гешефт
    а это и новые технологии и цифровой контроль 
    интересно  что по этому думает Африка 
    а ведь по фактам вся эта технологическая конкуренция была всегда и мы в ней никогда не были в лидерах но как то держались 
    хотя не скажу что у нас нет шансов выстоять 
  • Текст написан лошком для лошков. Вот как выглядит полная картина без криков о том, что мы ничего не можем.
    1. Миф об убыточности и отрицательном FCF. Утверждение, что ни Сбер, ни Яндекс, ни другие корпорации не имеют положительного эффекта от внедрения собственных LLM, полностью опровергается официальной финансовой отчетностью компаний. В экосистемах ИИ оценивается не как отдельный продукт (через продажу токенов по API), а как технология сквозной оптимизации бизнеса.
    • Реальные цифры Сбера: За период 2024–2026 годов финансовый эффект для Сбера только от внедрения генеративного ИИ в свои внутренние процессы составил около 400-450 млрд рублей ежегодно. ИИ оптимизировал скоринг, клиентскую поддержку и написание кода. При инвестициях в ИИ на уровне 450 млрд рублей за три года, чистая прибыль от технологии превысила 800 млрд рублей. Это прямой вклад в рекордный FCF и чистую прибыль банка, которая за 7 месяцев 2025 года достигла 971,5 млрд рублей.
    • Реальные цифры Яндекса: Технологии YandexGPT интегрированы в Поиск, Маркет и облачную инфраструктуру. По итогам отчетов, скорректированная EBITDA Яндекса демонстрирует рекордные темпы (ожидаемый показатель на 2026 год — ~350 млрд рублей против 281 млрд рублей в 2025 году). Основной драйвер роста — рост эффективности сервисов за счет ИИ-автоматизации, что напрямую укрепляет денежный поток компании.
    2. Ошибочный тезис о «скачивании чужих весов» и зависимости от APIТезис о том, что российские компании просто «выкачивают веса» китайских открытых моделей, технически некорректен. Большие языковые модели Сбера и Яндекса строятся на фундаментально иной архитектуре и данных. Фундаментальная разработка: Модель GigaChat 3 Ultra от Сбера имеет архитектуру MoE (Mixture of Experts) с общим числом параметров 702 миллиарда. Яндекс также разрабатывает и публикует собственные модели, например, YandexGPT 5. Эти модели создаются внутри компаний с нуля (From Scratch) на базе терабайтов очищенных русскоязычных данных, а не кастомизируются из зарубежного Open Source. Закрытие китайских моделей никак не повлияет на их технологический стек.
    • Михаил
      Вчера в 13:56
      Александр Сережкин, 
      > языковые модели Сбера и Яндекса строятся на фундаментально иной архитектуре и данных. Фундаментальная разработка: Модель GigaChat 3 Ultra от Сбера имеет архитектуру MoE (Mixture of Experts)

      Практическое использование Mixture of Experts популяризовал DeepSeek — тут нет ничего уникального. Яндекс не скрывает, что он берет веса китайских моделей. Да он их немного файнтюнит и прикручивает свой harness, но чего-то разработать и натренировать с нуля у него ресурсов нет. Про Сбер не знаю, но большое подозрение, что там ровно так же. Модели абсолютно вторичные, но это в принципе не значит, что они совсем бесполезные — за счет тюнига и harness можно многое сделать для учета российской специфики
      • CashBack
        Вчера в 15:02
        Михаил, не тянут
  • 3. Миф об отсутствии мощностей ЦОД и «десятках лет отставания»Российский рынок облачных вычислений и суперкомпьютеров не стагнирует, а переживает масштабный инвестиционный бум, нацеленный на полную импортонезависимость инфраструктуры.
    Параметр сравнения Утверждение критика Действительность (Данные 2025-2026 гг.)
    Инвестиции в вычислительные мощности Отсутствие бюджетов и мощностей для создания ЦОД Сбер увеличил инвестиции в генеративный ИИ до 600 млрд рублей на период 2024–2026 гг. Yandex Cloud инвестирует 42 млрд рублей в инфраструктуру.
    Качество моделей на русском языке Отставание на годы и десятилетия от США и Китая В задачах на русском языке (бенчмарк MERA) YandexGPT и GigaChat обходят зарубежные аналоги, так как априори обладают лучшей языковой плотностью и культурным контекстом.
    С точки зрения управления информацией, Сбер и Яндекс действуют стратегически верно: они формируют собственные активы данных (Data Assets) и вычислительную независимость. Переход Китая к закрытым коммерческим моделям никак не ухудшит FCF российских гигантов. Напротив, наличие собственных зрелых LLM-решений защищает российский бизнес от геополитических рисков и инфраструктурного шантажа со стороны как США, так и КНР.
      • Noname Research, через западные блумберги, как тебе такое?
          • Noname Research, ты слишком нагибаешься перед западом и поэтому не видишь горизонт перспективы. Но таких как ты тысячи людей из-за плохого образования и зависти.
      • VladMih
        Вчера в 14:47
        Noname Research, без обид. Ваш пост точно похож на сводку от ИИ.
        По-честному пытался дочитать, т.к. тема мне интересна (очень плотно применяю их на практике!), но… не дочитал,
        а попутно запутался — о чём пост, главное — для кого и зачем?

        Можно двумя словами о его цели и выводах?
        Неужели всё ради последней жирной строчки?
    • Михаил
      Вчера в 13:59
      Александр Сережкин, то есть инвестиции около ~0,5 млрд долларов — на досуге сравните это с инвестициями OpenAI
    • Александр Сережкин, Есть еще вопросы?

      Вот конкретно твои две модели даже не в 10ке Про деньги я вообще молчу. Это мизер по сравнению с тем, сколько Китай и США вкладывают. Ла лаже немцы, которые вообще в аутсайде и то больше инвестируют в разы. 
      • Антон Б
        Сегодня в 13:19

        Миллиардер из Сибири, mera.a-ai.ru/ru/text/leaderboard

        Х
        отя-бы частично русские модели (понятно что база это открытые модели

        BerryLM-v2-reasoning-budget-low 30.0BWildberries & Russ
        Cotype Light 3 9.0B  в топ 10 из русских моделей от mts mts.ai/product/wordpulse/ для своего размера топчик!

        10 BerryLM-L 120.0B 14 BerryLM-MT 20.0B Wildberrise — т 16 GigaChat-3.1-Ultra 702.0B — 702b и уступает в ДВОЕ по меступросто позорище!!! для своих весов 702B
        для сравнение топ для дома:
        Qwen3.6-35B-A3B которая может работать на 15 летнем Xeon 2670v3  вообще! без видеокарты.
        на железе стоимостью 300! долларов! на авито.

        а на прилично железе домашнем хотя-бы за 2к долларов просто комфортно работает ЛОКАЛЬНО!!!!
        • Антон Б, И? Та же таблица.
          • Антон Б
            Сегодня в 13:22
            Миллиардер из Сибири, да, но просто ты так написал что там вообще русских команд нет.
            а там в десятке 3 русских команды.
            • Антон Б, Я написал. «Вот конкретно твои две модели даже не в 10ке» Да модели есть. Но они точно не 
              В задачах на русском языке (бенчмарк MERA) YandexGPT и GigaChat обходят зарубежные аналоги, так как априори обладают лучшей языковой плотностью и культурным контекстом.
  • ВВШ  Free.Solo.
    Вчера в 13:50
    ИИ  будущего либо  универсален и связан со всеми в  мире, либо как религии полон  денег   политики и подделок. всё.
  • Sianuk
    Вчера в 13:59
    Забаньте этого чудика, он пишет чушь
  • Synthetic
    Вчера в 14:57
    Модели, модели...
    Да у нас аппаратного обеспечения нет суверенного. Совсем нет. И в текущую геологическую эпоху вряд ли оно появится.
  • CashBack
    Вчера в 15:09
    Открытые системы всегда и во все времена развиваются быстрее. На старте Гигп чат мод и был ничего, но чем дальше тем, слабее.
    Почему? Нет обмена, не дополнений передовых и новых фичей. Идет интеграция между компаниями Тем же нвидиа. Это гипер важно, это уже прикладная тема. Бизнесу не нужны галюцинированные модели. Отсюда и гипер развитие той же роботехники. Тут есть движение?
    В Казахстане беспилотное такси запускают. Закрытые системы стабильны, но развиваются медленно, нужно гига чатам получше работать- а то там миллионы платят за сбор статусов или страусов не ясно пока
  • Дмитрий
    Вчера в 16:02
    Суверенное ИИ.... это из тойже оперы, что и суверенная демократия )
  • smit
    Вчера в 21:01
    Верно ли я понял что если не создать собственого AI которое по тестам будет лучше китайских или американских моделей, то суверенное ИИ невозможно… суверенное ИИ.

    Автор может оценить что же измениться если у нас будет такой AI?

     
  • я почему то думаю, что умение думать не есть функция количества чего то там 
    а качества 
    давно запомнил, одна голова хорошо а две лучше
    только в случае если головами вышибать закрытую дверь 
    так что похоже ИИ ждет путь пузырька 
  • ✔  ⓈⒺⓇⒼⒾⓄ:Ⓩ
    Сегодня в 00:06
    суверенное  — тут лишнее слово однако...
  • Pol Noblivios
    Сегодня в 12:31
     Суверенный ИИ, это из той-же оперы, что и отечественный, суверенный автопром.
  • Григорий
    Сегодня в 14:06
    удивительно, как все забыли про зеленую повестку…
  • Григорий
    Сегодня в 14:11
     Статья очень познавательная, спасибо!

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн