Noname Research
Noname Research личный блог
Вчера в 12:16

Суверенное ИИ в РФ невозможно

#AI #datacenters #YDEX #SBER

t.me/zzz_NonameResearch

Со стороны компаний часто можно увидеть информационные вбросы по поводу того что по каким-то бенчмаркам Гигачат Сбера или Алиса AI Яндекса обошли какие-то китайские LLM модели. Главы компаний на различных отраслевых мероприятиях говорят о том, что они находятся на острие технологического прогресса в сфере ИИ.

В этом посте я хочу объяснить почему это все попросту не может быть правдой и не будет правдой в ближайшие 5 лет как минимум, да и в целом наверное никогда. 

_______________

Сначала давайте убедимся в том, что Российские модели сильно отстают от передовых моделей США и Китая

В таблице ниже приведено сравнение передовых (фронтирных/frontier) моделей от текущих глобальных лидеров в этом напарвлении (Anthropic с моделью Claude, Open AI с моделью Chat GPT и Google c моделью Gemini), от китайских лидеров (Alibaba c Qwen и DeepSeek) c нашими моделями от Яндекса и Сбера.

Суверенное ИИ в РФ невозможно

Сразу следует отметить, что по российским моделям тяжело собрать сопоставимые данные. Российские модели объективно отстают на поколение-полтора, и их собственные бенчмарки несопоставимы с международными (тестировались против GPT-4o/Qwen-2.5, а не текущих флагманов) поэтому сравнение получается неполным.

Дам вам еще немного контекста по поводу Российских LLM

Суверенное ИИ в РФ невозможно

З
десь также очень важно отметить, что модели Alice AI ВСЕГДА являются дообученными под русский язык, контекст и клиентские данные клиентов Яндекса открытыми (open-source) моделями от Qwen (Alibaba), а модели Gigachat всегда являются дообученными под русский язык, контекст и клиентские данные клиентов Сбера открытыми моделями от DeepSeek.

То есть и Яндекс и Сбер пропускают самый затратный (и по количеству часов вычислений и по количеству необходимых чипов и по количеству необходимых денег и специалистов) этап создания LLM-моделей — training phase. На этом этапе методом подбора формируются модельные веса для всех параметров (нейронов) модели (например в последнем DeepSeek сейчас 1.6 трлн. параметров). В этот момент сотни тысяч GPU/ASIC чипов работают как единое целое в нескольких передовых кластеров ЦОДов, тратятся Тераватты энергии. А чтобы вообще сделать возможным синхронную работу нескольких сотен тысяч чипов — тратятся десятки миллиардов долларов на создание передовых инженерных и инфрастурктурных систем внутри ЦОД, передовых вычислительных чипов (GPU/ASIC), чипов памяти (HBM, DRAM, SSD), оптических соединений типа scale-up, scale-out и scale-across и т.д. и т.п.

Это означает, что модели Яндекса и Сбера каждый год конечно становятся лучше, но они становятся лучше только потому что выходят новые модели от Qwen и DeepSeek. Qwen и DeepSeek пока что каждую модель которую выпускают — выпускают в формате open-source. Это означает, что любая организация может скачать огромный исходный файл с подобранными (на этапе training) весами для нейронов внутри модели, развернуть эту модель на своих локальных серверах и сказать что типа вот у нас есть своя LLM, она работает. 

DeepSeek и Qwen пока что так делают, потому что создают ценовую конкуренцию для фронтирных моделей США. Я писал отдельный пост, почему фронтирные модели США на самом деле существенно лучше несмотря на близость оценок по различным бенчмаркам, и почему Китайцы тоже пока их не могут догнать и не смогут в ближайшее время (спойлер — из-за оборудования и чипов). Если вам интересно, то можете ознакомиться тут t.me/zzz_NonameResearch/2300

Но на самом деле это уже не сильно работает и это заметно по темпу ускорения ARR (annual run-rate — прогнозная выручки на 12М исходя из перемножения текущей месячной выручки на 12) у компании Anthropic которая в феврале 2026 г. выпустила сенсационную модель Claude Opus 4.6, которая позволила существенно расширить сферы применения ИИ (вплоть до того что оно теперь само может рисовать презентации и делать финансовые модели).

Суверенное ИИ в РФ невозможно
То есть несмотря на то, что по бенчмаркам последний DeepSeek v4 несильно отстает от Claude — на практике эти бенчмарки не учитывают несколько компонентов модели, которые позволяют выполнять сложные комплексные и длинные задачи или не позволяют, а также эти бенчмарки не полностью учитывают то на каких чипах работают эти LLM — а чипы США значительно превосходят Китайские чипы.

Суверенное ИИ в РФ невозможно
К
 чему я это все? К тому что, в скором времени мы можем увидеть, что Китайские компании перестанут выкладывать модели в Open-source потому что поймут, что свою выручку они теряют, а компаниям из США при этом особо не мешают. 

На самом деле мы уже это видим. Alibaba перестала давать открытый доступ к своим самым передовым моделям. Остальные компании могут пойти по этому же пути.

Суверенное ИИ в РФ невозможно

К такому решению на самом деле приводит не только тот факт, что компаниям из США open-source подход Китайцев не смог помешать. Это также связано в целом с активным ростом потребления китайских LLM населением как Китая так и других стран. То есть разрбаотчики LLM сжигают миллиарды долларов на обеспечение inference своих LLM и ничего не получают. Inference значительно вырос, соотвественно есть спрос, а если есть спрос — значит надо собирать деньги и это абсолютно логично.  

Суверенное ИИ в РФ невозможно

То есть теперь, по мере того как Китайцы начнут закрывать доступ к своим передовым моделям — организации не смогут выкачать их веса и поставить к себе модель на локальные серверы и говорить что это их модель. Им придется тратить кучу денег на покупку доступа к этим моделям через API. Ни Сбер, ни Яндекс не имели положительного FCF от разработки «своих»  LLM — как и ни одна компания в мире пока что. А теперь их FCF станет еще хуже, если они захотят продолжать показывать, что «их» LLM становятся умнее — им просто придется теперь покупать доступ к новым LLM.

Тут есть конечно другой выход — ждать полгода-год пока Китайцы не выпустят модели еще лучше предыдущих платных и тогда сделают новые модели платными а старые бесплатными — и тогда Сбер и Яндекс скачают эти модели на свои сервера и скажут что типа ребята смотрите мы пипец как продвинулись. 

Но тогда это будет означать, что мы всегда на год позади Китайских моделей, а вообще по сути мы на десятки лет позади, потому что у нас нету достаточных мощностей ЦОД чтобы сделать training. А китайские модели в свою очередь всегда на 1-1.5 позади Американских моделей

При этом если Китайцы вообще перестанут выкладывать модели в Open-Source — то:

1) Либо FCF Яндекса и Сбера существенно ухудшится

2) Либо они перестанут улучшать свои LLM и люди просто со временем перестанут ими пользоваться, потому что они ничего не могут по сравнению с тем что есть в мире. Я сейчас не говорю о гуглинге с помощью Алисы конечно — это как продолжение браузера

3) Либо они скажут, что закрывают эту лавочку и Российское ИИ невозможно — посмотрят правде в глаза

Закончить еще хочу Графиком и таблицей, в которых видны CAPEX на ЦОДы Китайцев и США. На эти таблицы необходимо смотреть, зная что Яндекс и Сбер тратят на развитие ИИ (закупку GPU от Nvidia через третьи страны и строительство ЦОДов которые могут выдерживать LLM-inference нагрузки) сотни миллиардов рублей. Если конкретнее, то:

Яндекс тратит примерно 150-200 млрд рублей (2-2.5 млрд долл.) 

Сбер тратит в 2 раза больше — 300-400 млрд руб. (4-5 млрд долл.)

А теперь смотрим на затраты в долл. у Мировых и Китайских лидеров

Суверенное ИИ в РФ невозможно

Думаю, это очень показательно для того чтобы закончить данный пост тезисом — «Суверенное ИИ в РФ невозможно, мы либо будем покупать технологии Китая либо технологии США»

 

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
33 Комментария
  • Да не парься. Можно поднять и раскрутить свои технологии. За тридцать лет. И ты заплатишь за это из своего кармана.
  • да
    вы правы 
    нам остается закрыть свой интернет и закапсулироваться 
    амеры и китай чешут мировой спрос и могут позволить себе миллиарды тратить и получать с этого свой гешефт
    а это и новые технологии и цифровой контроль 
    интересно  что по этому думает Африка 
    а ведь по фактам вся эта технологическая конкуренция была всегда и мы в ней никогда не были в лидерах но как то держались 
    хотя не скажу что у нас нет шансов выстоять 
  • Текст написан лошком для лошков. Вот как выглядит полная картина без криков о том, что мы ничего не можем.
    1. Миф об убыточности и отрицательном FCF. Утверждение, что ни Сбер, ни Яндекс, ни другие корпорации не имеют положительного эффекта от внедрения собственных LLM, полностью опровергается официальной финансовой отчетностью компаний. В экосистемах ИИ оценивается не как отдельный продукт (через продажу токенов по API), а как технология сквозной оптимизации бизнеса.
    • Реальные цифры Сбера: За период 2024–2026 годов финансовый эффект для Сбера только от внедрения генеративного ИИ в свои внутренние процессы составил около 400-450 млрд рублей ежегодно. ИИ оптимизировал скоринг, клиентскую поддержку и написание кода. При инвестициях в ИИ на уровне 450 млрд рублей за три года, чистая прибыль от технологии превысила 800 млрд рублей. Это прямой вклад в рекордный FCF и чистую прибыль банка, которая за 7 месяцев 2025 года достигла 971,5 млрд рублей.
    • Реальные цифры Яндекса: Технологии YandexGPT интегрированы в Поиск, Маркет и облачную инфраструктуру. По итогам отчетов, скорректированная EBITDA Яндекса демонстрирует рекордные темпы (ожидаемый показатель на 2026 год — ~350 млрд рублей против 281 млрд рублей в 2025 году). Основной драйвер роста — рост эффективности сервисов за счет ИИ-автоматизации, что напрямую укрепляет денежный поток компании.
    2. Ошибочный тезис о «скачивании чужих весов» и зависимости от APIТезис о том, что российские компании просто «выкачивают веса» китайских открытых моделей, технически некорректен. Большие языковые модели Сбера и Яндекса строятся на фундаментально иной архитектуре и данных. Фундаментальная разработка: Модель GigaChat 3 Ultra от Сбера имеет архитектуру MoE (Mixture of Experts) с общим числом параметров 702 миллиарда. Яндекс также разрабатывает и публикует собственные модели, например, YandexGPT 5. Эти модели создаются внутри компаний с нуля (From Scratch) на базе терабайтов очищенных русскоязычных данных, а не кастомизируются из зарубежного Open Source. Закрытие китайских моделей никак не повлияет на их технологический стек.
  • 3. Миф об отсутствии мощностей ЦОД и «десятках лет отставания»Российский рынок облачных вычислений и суперкомпьютеров не стагнирует, а переживает масштабный инвестиционный бум, нацеленный на полную импортонезависимость инфраструктуры.
    Параметр сравнения Утверждение критика Действительность (Данные 2025-2026 гг.)
    Инвестиции в вычислительные мощности Отсутствие бюджетов и мощностей для создания ЦОД Сбер увеличил инвестиции в генеративный ИИ до 600 млрд рублей на период 2024–2026 гг. Yandex Cloud инвестирует 42 млрд рублей в инфраструктуру.
    Качество моделей на русском языке Отставание на годы и десятилетия от США и Китая В задачах на русском языке (бенчмарк MERA) YandexGPT и GigaChat обходят зарубежные аналоги, так как априори обладают лучшей языковой плотностью и культурным контекстом.
    С точки зрения управления информацией, Сбер и Яндекс действуют стратегически верно: они формируют собственные активы данных (Data Assets) и вычислительную независимость. Переход Китая к закрытым коммерческим моделям никак не ухудшит FCF российских гигантов. Напротив, наличие собственных зрелых LLM-решений защищает российский бизнес от геополитических рисков и инфраструктурного шантажа со стороны как США, так и КНР.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн