#AI #datacenters #YDEX #SBER
Со стороны компаний часто можно увидеть информационные вбросы по поводу того что по каким-то бенчмаркам Гигачат Сбера или Алиса AI Яндекса обошли какие-то китайские LLM модели. Главы компаний на различных отраслевых мероприятиях говорят о том, что они находятся на острие технологического прогресса в сфере ИИ.
В этом посте я хочу объяснить почему это все попросту не может быть правдой и не будет правдой в ближайшие 5 лет как минимум, да и в целом наверное никогда.
_______________
Сначала давайте убедимся в том, что Российские модели сильно отстают от передовых моделей США и Китая
В таблице ниже приведено сравнение передовых (фронтирных/frontier) моделей от текущих глобальных лидеров в этом напарвлении (Anthropic с моделью Claude, Open AI с моделью Chat GPT и Google c моделью Gemini), от китайских лидеров (Alibaba c Qwen и DeepSeek) c нашими моделями от Яндекса и Сбера.
Сразу следует отметить, что по российским моделям тяжело собрать сопоставимые данные. Российские модели объективно отстают на поколение-полтора, и их собственные бенчмарки несопоставимы с международными (тестировались против GPT-4o/Qwen-2.5, а не текущих флагманов) поэтому сравнение получается неполным.
Дам вам еще немного контекста по поводу Российских LLM

Здесь также очень важно отметить, что модели Alice AI ВСЕГДА являются дообученными под русский язык, контекст и клиентские данные клиентов Яндекса открытыми (open-source) моделями от Qwen (Alibaba), а модели Gigachat всегда являются дообученными под русский язык, контекст и клиентские данные клиентов Сбера открытыми моделями от DeepSeek.
То есть и Яндекс и Сбер пропускают самый затратный (и по количеству часов вычислений и по количеству необходимых чипов и по количеству необходимых денег и специалистов) этап создания LLM-моделей — training phase. На этом этапе методом подбора формируются модельные веса для всех параметров (нейронов) модели (например в последнем DeepSeek сейчас 1.6 трлн. параметров). В этот момент сотни тысяч GPU/ASIC чипов работают как единое целое в нескольких передовых кластеров ЦОДов, тратятся Тераватты энергии. А чтобы вообще сделать возможным синхронную работу нескольких сотен тысяч чипов — тратятся десятки миллиардов долларов на создание передовых инженерных и инфрастурктурных систем внутри ЦОД, передовых вычислительных чипов (GPU/ASIC), чипов памяти (HBM, DRAM, SSD), оптических соединений типа scale-up, scale-out и scale-across и т.д. и т.п.
Это означает, что модели Яндекса и Сбера каждый год конечно становятся лучше, но они становятся лучше только потому что выходят новые модели от Qwen и DeepSeek. Qwen и DeepSeek пока что каждую модель которую выпускают — выпускают в формате open-source. Это означает, что любая организация может скачать огромный исходный файл с подобранными (на этапе training) весами для нейронов внутри модели, развернуть эту модель на своих локальных серверах и сказать что типа вот у нас есть своя LLM, она работает.
DeepSeek и Qwen пока что так делают, потому что создают ценовую конкуренцию для фронтирных моделей США. Я писал отдельный пост, почему фронтирные модели США на самом деле существенно лучше несмотря на близость оценок по различным бенчмаркам, и почему Китайцы тоже пока их не могут догнать и не смогут в ближайшее время (спойлер — из-за оборудования и чипов). Если вам интересно, то можете ознакомиться тут t.me/zzz_NonameResearch/2300
Но на самом деле это уже не сильно работает и это заметно по темпу ускорения ARR (annual run-rate — прогнозная выручки на 12М исходя из перемножения текущей месячной выручки на 12) у компании Anthropic которая в феврале 2026 г. выпустила сенсационную модель Claude Opus 4.6, которая позволила существенно расширить сферы применения ИИ (вплоть до того что оно теперь само может рисовать презентации и делать финансовые модели).

То есть несмотря на то, что по бенчмаркам последний DeepSeek v4 несильно отстает от Claude — на практике эти бенчмарки не учитывают несколько компонентов модели, которые позволяют выполнять сложные комплексные и длинные задачи или не позволяют, а также эти бенчмарки не полностью учитывают то на каких чипах работают эти LLM — а чипы США значительно превосходят Китайские чипы.

К чему я это все? К тому что, в скором времени мы можем увидеть, что Китайские компании перестанут выкладывать модели в Open-source потому что поймут, что свою выручку они теряют, а компаниям из США при этом особо не мешают.
На самом деле мы уже это видим. Alibaba перестала давать открытый доступ к своим самым передовым моделям. Остальные компании могут пойти по этому же пути.
К такому решению на самом деле приводит не только тот факт, что компаниям из США open-source подход Китайцев не смог помешать. Это также связано в целом с активным ростом потребления китайских LLM населением как Китая так и других стран. То есть разрбаотчики LLM сжигают миллиарды долларов на обеспечение inference своих LLM и ничего не получают. Inference значительно вырос, соотвественно есть спрос, а если есть спрос — значит надо собирать деньги и это абсолютно логично.

То есть теперь, по мере того как Китайцы начнут закрывать доступ к своим передовым моделям — организации не смогут выкачать их веса и поставить к себе модель на локальные серверы и говорить что это их модель. Им придется тратить кучу денег на покупку доступа к этим моделям через API. Ни Сбер, ни Яндекс не имели положительного FCF от разработки «своих» LLM — как и ни одна компания в мире пока что. А теперь их FCF станет еще хуже, если они захотят продолжать показывать, что «их» LLM становятся умнее — им просто придется теперь покупать доступ к новым LLM.
Тут есть конечно другой выход — ждать полгода-год пока Китайцы не выпустят модели еще лучше предыдущих платных и тогда сделают новые модели платными а старые бесплатными — и тогда Сбер и Яндекс скачают эти модели на свои сервера и скажут что типа ребята смотрите мы пипец как продвинулись.
Но тогда это будет означать, что мы всегда на год позади Китайских моделей, а вообще по сути мы на десятки лет позади, потому что у нас нету достаточных мощностей ЦОД чтобы сделать training. А китайские модели в свою очередь всегда на 1-1.5 позади Американских моделей
При этом если Китайцы вообще перестанут выкладывать модели в Open-Source — то:
1) Либо FCF Яндекса и Сбера существенно ухудшится
2) Либо они перестанут улучшать свои LLM и люди просто со временем перестанут ими пользоваться, потому что они ничего не могут по сравнению с тем что есть в мире. Я сейчас не говорю о гуглинге с помощью Алисы конечно — это как продолжение браузера
3) Либо они скажут, что закрывают эту лавочку и Российское ИИ невозможно — посмотрят правде в глаза
Закончить еще хочу Графиком и таблицей, в которых видны CAPEX на ЦОДы Китайцев и США. На эти таблицы необходимо смотреть, зная что Яндекс и Сбер тратят на развитие ИИ (закупку GPU от Nvidia через третьи страны и строительство ЦОДов которые могут выдерживать LLM-inference нагрузки) сотни миллиардов рублей. Если конкретнее, то:
— Яндекс тратит примерно 150-200 млрд рублей (2-2.5 млрд долл.)
— Сбер тратит в 2 раза больше — 300-400 млрд руб. (4-5 млрд долл.)
А теперь смотрим на затраты в долл. у Мировых и Китайских лидеров

Думаю, это очень показательно для того чтобы закончить данный пост тезисом — «Суверенное ИИ в РФ невозможно, мы либо будем покупать технологии Китая либо технологии США»
вы правы
нам остается закрыть свой интернет и закапсулироваться
амеры и китай чешут мировой спрос и могут позволить себе миллиарды тратить и получать с этого свой гешефт
а это и новые технологии и цифровой контроль
интересно что по этому думает Африка
а ведь по фактам вся эта технологическая конкуренция была всегда и мы в ней никогда не были в лидерах но как то держались
хотя не скажу что у нас нет шансов выстоять
1. Миф об убыточности и отрицательном FCF. Утверждение, что ни Сбер, ни Яндекс, ни другие корпорации не имеют положительного эффекта от внедрения собственных LLM, полностью опровергается официальной финансовой отчетностью компаний. В экосистемах ИИ оценивается не как отдельный продукт (через продажу токенов по API), а как технология сквозной оптимизации бизнеса.
- Реальные цифры Сбера: За период 2024–2026 годов финансовый эффект для Сбера только от внедрения генеративного ИИ в свои внутренние процессы составил около 400-450 млрд рублей ежегодно. ИИ оптимизировал скоринг, клиентскую поддержку и написание кода. При инвестициях в ИИ на уровне 450 млрд рублей за три года, чистая прибыль от технологии превысила 800 млрд рублей. Это прямой вклад в рекордный FCF и чистую прибыль банка, которая за 7 месяцев 2025 года достигла 971,5 млрд рублей.
- Реальные цифры Яндекса: Технологии YandexGPT интегрированы в Поиск, Маркет и облачную инфраструктуру. По итогам отчетов, скорректированная EBITDA Яндекса демонстрирует рекордные темпы (ожидаемый показатель на 2026 год — ~350 млрд рублей против 281 млрд рублей в 2025 году). Основной драйвер роста — рост эффективности сервисов за счет ИИ-автоматизации, что напрямую укрепляет денежный поток компании.
2. Ошибочный тезис о «скачивании чужих весов» и зависимости от APIТезис о том, что российские компании просто «выкачивают веса» китайских открытых моделей, технически некорректен. Большие языковые модели Сбера и Яндекса строятся на фундаментально иной архитектуре и данных. Фундаментальная разработка: Модель GigaChat 3 Ultra от Сбера имеет архитектуру MoE (Mixture of Experts) с общим числом параметров 702 миллиарда. Яндекс также разрабатывает и публикует собственные модели, например, YandexGPT 5. Эти модели создаются внутри компаний с нуля (From Scratch) на базе терабайтов очищенных русскоязычных данных, а не кастомизируются из зарубежного Open Source. Закрытие китайских моделей никак не повлияет на их технологический стек.