Noname Research личный блог

24 мая 2026, 12:16

Суверенное ИИ в РФ невозможно

#AI #datacenters #YDEX #SBER

Со стороны компаний часто можно увидеть информационные вбросы по поводу того что по каким-то бенчмаркам Гигачат Сбера или Алиса AI Яндекса обошли какие-то китайские LLM модели. Главы компаний на различных отраслевых мероприятиях говорят о том, что они находятся на острие технологического прогресса в сфере ИИ.

В этом посте я хочу объяснить почему это все попросту не может быть правдой и не будет правдой в ближайшие 5 лет как минимум, да и в целом наверное никогда.

_______________

Сначала давайте убедимся в том, что Российские модели сильно отстают от передовых моделей США и Китая

В таблице ниже приведено сравнение передовых (фронтирных/frontier) моделей от текущих глобальных лидеров в этом напарвлении (Anthropic с моделью Claude, Open AI с моделью Chat GPT и Google c моделью Gemini), от китайских лидеров (Alibaba c Qwen и DeepSeek) c нашими моделями от Яндекса и Сбера.

Сразу следует отметить, что по российским моделям тяжело собрать сопоставимые данные. Российские модели объективно отстают на поколение-полтора, и их собственные бенчмарки несопоставимы с международными (тестировались против GPT-4o/Qwen-2.5, а не текущих флагманов) поэтому сравнение получается неполным.

Дам вам еще немного контекста по поводу Российских LLM

Здесь также очень важно отметить, что модели Alice AI ВСЕГДА являются дообученными под русский язык, контекст и клиентские данные клиентов Яндекса открытыми (open-source) моделями от Qwen (Alibaba), а модели Gigachat всегда являются дообученными под русский язык, контекст и клиентские данные клиентов Сбера открытыми моделями от DeepSeek.

То есть и Яндекс и Сбер пропускают самый затратный (и по количеству часов вычислений и по количеству необходимых чипов и по количеству необходимых денег и специалистов) этап создания LLM-моделей — training phase. На этом этапе методом подбора формируются модельные веса для всех параметров (нейронов) модели (например в последнем DeepSeek сейчас 1.6 трлн. параметров). В этот момент сотни тысяч GPU/ASIC чипов работают как единое целое в нескольких передовых кластеров ЦОДов, тратятся Тераватты энергии. А чтобы вообще сделать возможным синхронную работу нескольких сотен тысяч чипов — тратятся десятки миллиардов долларов на создание передовых инженерных и инфрастурктурных систем внутри ЦОД, передовых вычислительных чипов (GPU/ASIC), чипов памяти (HBM, DRAM, SSD), оптических соединений типа scale-up, scale-out и scale-across и т.д. и т.п.

Это означает, что модели Яндекса и Сбера каждый год конечно становятся лучше, но они становятся лучше только потому что выходят новые модели от Qwen и DeepSeek. Qwen и DeepSeek пока что каждую модель которую выпускают — выпускают в формате open-source. Это означает, что любая организация может скачать огромный исходный файл с подобранными (на этапе training) весами для нейронов внутри модели, развернуть эту модель на своих локальных серверах и сказать что типа вот у нас есть своя LLM, она работает.

DeepSeek и Qwen пока что так делают, потому что создают ценовую конкуренцию для фронтирных моделей США. Я писал отдельный пост, почему фронтирные модели США на самом деле существенно лучше несмотря на близость оценок по различным бенчмаркам, и почему Китайцы тоже пока их не могут догнать и не смогут в ближайшее время (спойлер — из-за оборудования и чипов). Если вам интересно, то можете ознакомиться тут t.me/zzz_NonameResearch/2300

Но на самом деле это уже не сильно работает и это заметно по темпу ускорения ARR (annual run-rate — прогнозная выручки на 12М исходя из перемножения текущей месячной выручки на 12) у компании Anthropic которая в феврале 2026 г. выпустила сенсационную модель Claude Opus 4.6, которая позволила существенно расширить сферы применения ИИ (вплоть до того что оно теперь само может рисовать презентации и делать финансовые модели).

То есть несмотря на то, что по бенчмаркам последний DeepSeek v4 несильно отстает от Claude — на практике эти бенчмарки не учитывают несколько компонентов модели, которые позволяют выполнять сложные комплексные и длинные задачи или не позволяют, а также эти бенчмарки не полностью учитывают то на каких чипах работают эти LLM — а чипы США значительно превосходят Китайские чипы.

К чему я это все? К тому что, в скором времени мы можем увидеть, что Китайские компании перестанут выкладывать модели в Open-source потому что поймут, что свою выручку они теряют, а компаниям из США при этом особо не мешают.

На самом деле мы уже это видим. Alibaba перестала давать открытый доступ к своим самым передовым моделям. Остальные компании могут пойти по этому же пути.

К такому решению на самом деле приводит не только тот факт, что компаниям из США open-source подход Китайцев не смог помешать. Это также связано в целом с активным ростом потребления китайских LLM населением как Китая так и других стран. То есть разрбаотчики LLM сжигают миллиарды долларов на обеспечение inference своих LLM и ничего не получают. Inference значительно вырос, соотвественно есть спрос, а если есть спрос — значит надо собирать деньги и это абсолютно логично.

То есть теперь, по мере того как Китайцы начнут закрывать доступ к своим передовым моделям — организации не смогут выкачать их веса и поставить к себе модель на локальные серверы и говорить что это их модель. Им придется тратить кучу денег на покупку доступа к этим моделям через API. Ни Сбер, ни Яндекс не имели положительного FCF от разработки «своих» LLM — как и ни одна компания в мире пока что. А теперь их FCF станет еще хуже, если они захотят продолжать показывать, что «их» LLM становятся умнее — им просто придется теперь покупать доступ к новым LLM.

Тут есть конечно другой выход — ждать полгода-год пока Китайцы не выпустят модели еще лучше предыдущих платных и тогда сделают новые модели платными а старые бесплатными — и тогда Сбер и Яндекс скачают эти модели на свои сервера и скажут что типа ребята смотрите мы пипец как продвинулись.

Но тогда это будет означать, что мы всегда на год позади Китайских моделей, а вообще по сути мы на десятки лет позади, потому что у нас нету достаточных мощностей ЦОД чтобы сделать training. А китайские модели в свою очередь всегда на 1-1.5 позади Американских моделей

При этом если Китайцы вообще перестанут выкладывать модели в Open-Source — то:

1) Либо FCF Яндекса и Сбера существенно ухудшится

2) Либо они перестанут улучшать свои LLM и люди просто со временем перестанут ими пользоваться, потому что они ничего не могут по сравнению с тем что есть в мире. Я сейчас не говорю о гуглинге с помощью Алисы конечно — это как продолжение браузера

3) Либо они скажут, что закрывают эту лавочку и Российское ИИ невозможно — посмотрят правде в глаза

Закончить еще хочу Графиком и таблицей, в которых видны CAPEX на ЦОДы Китайцев и США. На эти таблицы необходимо смотреть, зная что Яндекс и Сбер тратят на развитие ИИ (закупку GPU от Nvidia через третьи страны и строительство ЦОДов которые могут выдерживать LLM-inference нагрузки) сотни миллиардов рублей. Если конкретнее, то:

— Яндекс тратит примерно 150-200 млрд рублей (2-2.5 млрд долл.)

— Сбер тратит в 2 раза больше — 300-400 млрд руб. (4-5 млрд долл.)

А теперь смотрим на затраты в долл. у Мировых и Китайских лидеров

Думаю, это очень показательно для того чтобы закончить данный пост тезисом — «Суверенное ИИ в РФ невозможно, мы либо будем покупать технологии Китая либо технологии США»

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

искусственный интеллект ИИ

https://t.me/zzz_NonameResearch

Noname Research

Москва

521

с 24 октября 2024

33 Комментария

Дмитрий-Димас Ермаков
24 мая 2026, 12:23
Да не парься. Можно поднять и раскрутить свои технологии. За тридцать лет. И ты заплатишь за это из своего кармана.
0
- alvas
  24 мая 2026, 15:07
  Дмитрий-Димас Ермаков, за 30 лет представляешь на каком уровне будут технологии китайцев и США? это как телега и космический корабль
  0
  - Дмитрий-Димас Ермаков
    24 мая 2026, 15:22
    alvas, надо не догонять, надо решать проблемы. Свои реальные и текущие проблемы. Пускай бегут. Пускай ускоряются. Разведка достанет все эти секреты. Назначение управления оптимизировать деятельность и работу. Производство и сбыт. Науки и технологии. Связать науку, промышленность и торговлю. Клиента и инженера. Бизнес и население. Вот смысл управления.
    И то, чем занимается сейчас Запад — это не наука и не технологическое развитие. Это они так готовятся к апокалипсису. И создают ИИ как инструмент и оружие в борьбе за мировые ресурсы. Ты сейчас внутри картинки, которую нарисовали банкиры. И это не реальность, это картинка маркетологов. Тебе надо смотреть на мир строго научно. США и ЕС перед кризисом и катастрофой. Вот почему всё это, что ты читаешь в новостях. У них будет борьба с Китаем.
    0
    - alvas
      24 мая 2026, 16:37
      Дмитрий-Димас Ермаков, что ты такое несешь??? ИИ это прорыв в технологиях, который реально дает кучу преимуществ в других сферах, электронику и кучу еще чего успешно прокакали и запрагнуть в уходящий поезд не получится, тут хотя бы не упуска ли бы… но нет, даже не понимаете как это все опасно
      +1
      - Дмитрий-Димас Ермаков
        24 мая 2026, 16:55
        alvas, иди страдай молча, и без меня.
        0
      - alvas
        25 мая 2026, 12:46
        Что Дмитрочка ответить ничего не смог по существу?)))
        0
Валерий Калачев
24 мая 2026, 12:34
да
вы правы
нам остается закрыть свой интернет и закапсулироваться
амеры и китай чешут мировой спрос и могут позволить себе миллиарды тратить и получать с этого свой гешефт
а это и новые технологии и цифровой контроль
интересно что по этому думает Африка
а ведь по фактам вся эта технологическая конкуренция была всегда и мы в ней никогда не были в лидерах но как то держались
хотя не скажу что у нас нет шансов выстоять
+1
Александр Сережкин
24 мая 2026, 12:41
Текст написан лошком для лошков. Вот как выглядит полная картина без криков о том, что мы ничего не можем.
1. Миф об убыточности и отрицательном FCF. Утверждение, что ни Сбер, ни Яндекс, ни другие корпорации не имеют положительного эффекта от внедрения собственных LLM, полностью опровергается официальной финансовой отчетностью компаний. В экосистемах ИИ оценивается не как отдельный продукт (через продажу токенов по API), а как технология сквозной оптимизации бизнеса.
- Реальные цифры Сбера: За период 2024–2026 годов финансовый эффект для Сбера только от внедрения генеративного ИИ в свои внутренние процессы составил около 400-450 млрд рублей ежегодно. ИИ оптимизировал скоринг, клиентскую поддержку и написание кода. При инвестициях в ИИ на уровне 450 млрд рублей за три года, чистая прибыль от технологии превысила 800 млрд рублей. Это прямой вклад в рекордный FCF и чистую прибыль банка, которая за 7 месяцев 2025 года достигла 971,5 млрд рублей.
- Реальные цифры Яндекса: Технологии YandexGPT интегрированы в Поиск, Маркет и облачную инфраструктуру. По итогам отчетов, скорректированная EBITDA Яндекса демонстрирует рекордные темпы (ожидаемый показатель на 2026 год — ~350 млрд рублей против 281 млрд рублей в 2025 году). Основной драйвер роста — рост эффективности сервисов за счет ИИ-автоматизации, что напрямую укрепляет денежный поток компании.
2. Ошибочный тезис о «скачивании чужих весов» и зависимости от APIТезис о том, что российские компании просто «выкачивают веса» китайских открытых моделей, технически некорректен. Большие языковые модели Сбера и Яндекса строятся на фундаментально иной архитектуре и данных. Фундаментальная разработка: Модель GigaChat 3 Ultra от Сбера имеет архитектуру MoE (Mixture of Experts) с общим числом параметров 702 миллиарда. Яндекс также разрабатывает и публикует собственные модели, например, YandexGPT 5. Эти модели создаются внутри компаний с нуля (From Scratch) на базе терабайтов очищенных русскоязычных данных, а не кастомизируются из зарубежного Open Source. Закрытие китайских моделей никак не повлияет на их технологический стек.
+3
- Михаил
  24 мая 2026, 13:56
  Александр Сережкин,
  > языковые модели Сбера и Яндекса строятся на фундаментально иной архитектуре и данных. Фундаментальная разработка: Модель GigaChat 3 Ultra от Сбера имеет архитектуру MoE (Mixture of Experts)
  
  Практическое использование Mixture of Experts популяризовал DeepSeek — тут нет ничего уникального. Яндекс не скрывает, что он берет веса китайских моделей. Да он их немного файнтюнит и прикручивает свой harness, но чего-то разработать и натренировать с нуля у него ресурсов нет. Про Сбер не знаю, но большое подозрение, что там ровно так же. Модели абсолютно вторичные, но это в принципе не значит, что они совсем бесполезные — за счет тюнига и harness можно многое сделать для учета российской специфики
  +3
  - CashBack
    24 мая 2026, 15:02
    Михаил, не тянут
    0

Александр Сережкин

24 мая 2026, 12:37

3. Миф об отсутствии мощностей ЦОД и «десятках лет отставания»Российский рынок облачных вычислений и суперкомпьютеров не стагнирует, а переживает масштабный инвестиционный бум, нацеленный на полную импортонезависимость инфраструктуры.

Параметр сравнения	Утверждение критика	Действительность (Данные 2025-2026 гг.)
Инвестиции в вычислительные мощности	Отсутствие бюджетов и мощностей для создания ЦОД	Сбер увеличил инвестиции в генеративный ИИ до 600 млрд рублей на период 2024–2026 гг. Yandex Cloud инвестирует 42 млрд рублей в инфраструктуру.
Качество моделей на русском языке	Отставание на годы и десятилетия от США и Китая	В задачах на русском языке (бенчмарк MERA) YandexGPT и GigaChat обходят зарубежные аналоги, так как априори обладают лучшей языковой плотностью и культурным контекстом.

С точки зрения управления информацией, Сбер и Яндекс действуют стратегически верно: они формируют собственные активы данных (Data Assets) и вычислительную независимость. Переход Китая к закрытым коммерческим моделям никак не ухудшит FCF российских гигантов. Напротив, наличие собственных зрелых LLM-решений защищает российский бизнес от геополитических рисков и инфраструктурного шантажа со стороны как США, так и КНР.

Noname Research
24 мая 2026, 13:03
Александр Сережкин, комментарий сформирован через Гигачад? :D

+1
- Александр Сережкин
  24 мая 2026, 13:06
  Noname Research, через западные блумберги, как тебе такое?
  0
  - Noname Research
    24 мая 2026, 13:14
    Александр Сережкин, там по-английски пишут обычно просто, а у тебя все на русском. Думаю все-таки гигачад. Ну и там люди поумнее тебя работают, они бы не начинали с обзывательств, лошок
    +1
    - Александр Сережкин
      24 мая 2026, 13:16
      Noname Research, ты слишком нагибаешься перед западом и поэтому не видишь горизонт перспективы. Но таких как ты тысячи людей из-за плохого образования и зависти.
      +1
- VladMih
  24 мая 2026, 14:47
  Noname Research, без обид. Ваш пост точно похож на сводку от ИИ.
  По-честному пытался дочитать, т.к. тема мне интересна (очень плотно применяю их на практике!), но… не дочитал,
  а попутно запутался — о чём пост, главное — для кого и зачем?
  
  Можно двумя словами о его цели и выводах?
  Неужели всё ради последней жирной строчки?
  0
Михаил
24 мая 2026, 13:59
Александр Сережкин, то есть инвестиции около ~0,5 млрд долларов — на досуге сравните это с инвестициями OpenAI
0
Миллиардер из Сибири
25 мая 2026, 10:06
Александр Сережкин, Есть еще вопросы?

Вот конкретно твои две модели даже не в 10ке Про деньги я вообще молчу. Это мизер по сравнению с тем, сколько Китай и США вкладывают. Ла лаже немцы, которые вообще в аутсайде и то больше инвестируют в разы.
+1
- Антон Б
  25 мая 2026, 13:19
  Миллиардер из Сибири, mera.a-ai.ru/ru/text/leaderboard
  
  Хотя-бы частично русские модели (понятно что база это открытые модели
  4 BerryLM-v2-reasoning-budget-low 30.0BWildberries & Russ
  7 Cotype Light 3 9.0B в топ 10 из русских моделей от mts mts.ai/product/wordpulse/ для своего размера топчик!
  
  10 BerryLM-L 120.0B 14 BerryLM-MT 20.0B Wildberrise — т 16 GigaChat-3.1-Ultra 702.0B — 702b и уступает в ДВОЕ по меступросто позорище!!! для своих весов 702B
  для сравнение топ для дома:
  8 Qwen3.6-35B-A3B которая может работать на 15 летнем Xeon 2670v3 вообще! без видеокарты.
  на железе стоимостью 300! долларов! на авито.
  
  а на прилично железе домашнем хотя-бы за 2к долларов просто комфортно работает ЛОКАЛЬНО!!!!
  0
  - Миллиардер из Сибири
    25 мая 2026, 13:16
    Антон Б, И? Та же таблица.
    +1
    - Антон Б
      25 мая 2026, 13:22
      Миллиардер из Сибири, да, но просто ты так написал что там вообще русских команд нет.
      а там в десятке 3 русских команды.
      0
      - Миллиардер из Сибири
        25 мая 2026, 13:36
        Антон Б, Я написал. «Вот конкретно твои две модели даже не в 10ке» Да модели есть. Но они точно не
        
        В задачах на русском языке (бенчмарк MERA) YandexGPT и GigaChat обходят зарубежные аналоги, так как априори обладают лучшей языковой плотностью и культурным контекстом.
        +1

ВВШ Free.Solo.
24 мая 2026, 13:50
ИИ будущего либо универсален и связан со всеми в мире, либо как религии полон денег политики и подделок. всё.
0
Sianuk
24 мая 2026, 13:59
Забаньте этого чудика, он пишет чушь
-1
Synthetic
24 мая 2026, 14:57
Модели, модели...
Да у нас аппаратного обеспечения нет суверенного. Совсем нет. И в текущую геологическую эпоху вряд ли оно появится.

+2
CashBack
24 мая 2026, 15:09
Открытые системы всегда и во все времена развиваются быстрее. На старте Гигп чат мод и был ничего, но чем дальше тем, слабее.
Почему? Нет обмена, не дополнений передовых и новых фичей. Идет интеграция между компаниями Тем же нвидиа. Это гипер важно, это уже прикладная тема. Бизнесу не нужны галюцинированные модели. Отсюда и гипер развитие той же роботехники. Тут есть движение?
В Казахстане беспилотное такси запускают. Закрытые системы стабильны, но развиваются медленно, нужно гига чатам получше работать- а то там миллионы платят за сбор статусов или страусов не ясно пока
+1
Дмитрий
24 мая 2026, 16:02
Суверенное ИИ.... это из тойже оперы, что и суверенная демократия )
+3
smit
24 мая 2026, 21:01
Верно ли я понял что если не создать собственого AI которое по тестам будет лучше китайских или американских моделей, то суверенное ИИ невозможно… суверенное ИИ.

Автор может оценить что же измениться если у нас будет такой AI?

0
Валерий Калачев
24 мая 2026, 23:50
я почему то думаю, что умение думать не есть функция количества чего то там
а качества
давно запомнил, одна голова хорошо а две лучше
только в случае если головами вышибать закрытую дверь
так что похоже ИИ ждет путь пузырька
0
✔ ⓈⒺⓇⒼⒾⓄ:Ⓩ
25 мая 2026, 00:06
суверенное — тут лишнее слово однако...
+1
Pol Noblivios
25 мая 2026, 12:31
Суверенный ИИ, это из той-же оперы, что и отечественный, суверенный автопром.
+1
Григорий

25 мая 2026, 14:06
удивительно, как все забыли про зеленую повестку…
0
Григорий

25 мая 2026, 14:11
Статья очень познавательная, спасибо!
-1

Читайте на SMART-LAB:

Выплатим 246,88 рубля на каждую акцию нашим акционерам уже в августе

Напоминаем, 17 июля – последний день для покупки акций с дивидендами. Лайк — если уже планируете реинвестировать дивиденды в акции ДОМ.PФ

ДОМ.РФ

15.07.2026

Чек честнее инфляции?

В открытой студии ТРЕЙДЕР ТВ на Smart-Lab Conf 2026 — КОТ ФИНАНС. Повод для разговора — статья, которая начинается с обычной покупки робота-пылесоса, но быстро превращается в большой разговор про...

LiveInvestingGroup

15.07.2026

📹 Главные инсайты с конференции Smart-Lab Conf 2026

Марина Харитонова, управляющий партнёр Accent, выступила на конференции Смартлаб в Санкт-Петербурге и ответила на вопрос, который волнует многих ⬇️ — Как войти в «клуб рантье» и можно ли с...