🛠️ Технический переход DeepSeek: почему платформа сбоит и что будет в V4
Пользователи DeepSeek в последние недели всё чаще сталкиваются с перебоями в работе: сервер выдаёт ошибку, файлы не загружаются, диалоги прерываются. На первый взгляд — банальная нестабильность. Но за этими сбоями стоит не просто перегрузка серверов, а масштабная техническая миграция. Разбираемся в деталях.
🏗️ Архитектура DeepSeek V4: что внутри
Новая модель представляет собой значительный скачок относительно предшественников. Вот ключевые технические характеристики:
· Mixture-of-Experts (MoE). Общий объём параметров — 1 триллион. Однако на каждый токен активируется лишь около 370 миллиардов параметров, что сохраняет эффективность и не даёт вычислительной нагрузке расти пропорционально размеру модели.
· Контекстное окно на 1 миллион токенов. Это примерно 15–20 романов уровня «Войны и мира», которые модель способна удерживать в оперативной памяти одновременно. Увеличение достигнуто за счёт новой архитектуры Engram — условной памяти, которая разделяет статическое хранение знаний и динамические вычисления. Простыми словами: факты и правила извлекаются из отдельного быстрого хранилища (DRAM), а не прогоняются через всю нейросеть заново, что экономит до 20–25% вычислительных ресурсов.
· Manifold-Constrained Hyper-Connections (mHC). Техника, решающая проблему нестабильности обучения при экстремально больших масштабах модели. Без неё V4 просто не удалось бы обучить до рабочего состояния — градиенты «схлопывались» бы на ранних этапах.
· Нативная мультимодальность. V4 с нуля обучена работать с текстом, изображениями, видео и аудио, без необходимости «прикручивать» модальности постфактум.
🔄 Переход на Huawei Ascend: цена технологической независимости
Ключевое изменение, которое отличает V4 от всех предыдущих версий — полный отказ от чипов NVIDIA и переход на китайские процессоры Huawei Ascend 950PR.
Технически это означает переписывание всего низкоуровневого кода с нуля. Дело в том, что NVIDIA десятилетиями выстраивала экосистему CUDA — программную платформу, на которой работают практически все современные нейросети. Huawei предлагает альтернативу — фреймворк CANN (Compute Architecture for Neural Networks). Инженерам DeepSeek пришлось вручную адаптировать ядро модели, переписывать ключевые операторы и оптимизировать распределённые вычисления под совершенно иную архитектуру.
Почему это сложно. В экосистеме NVIDIA для связи GPU используется NVLink — высокоскоростной интерфейс с пропускной способностью до терабайт в секунду, позволяющий сотням чипов работать как единый вычислительный кластер. В случае с Ascend такие «полносвязные» топологии пока недоступны, и инженерам приходится компенсировать это программными методами: оптимизировать маршруты передачи данных, управлять задержками и синхронизацией вручную.
Результат компромисса. По имеющимся данным, Ascend 950PR выдаёт примерно в 2,8 раза больше вычислительной мощности, чем NVIDIA H20 (наиболее производительный чип, разрешённый к экспорту в Китай), но всё ещё уступает флагманскому H200. При этом стоимость развёртывания на платформе Huawei оказывается примерно втрое ниже, чем на решениях NVIDIA.
⏳ Сбои как симптом перехода
Теперь становится понятнее, почему платформа работает нестабильно. Миграция такого масштаба — это не просто «переключить тумблер». Инженеры параллельно поддерживают текущую инфраструктуру (V3) и разворачивают новую (V4), перераспределяя серверные мощности. В периоды пиковой нагрузки или активного тестирования новой архитектуры часть сервисов — особенно ресурсоёмкая загрузка файлов — может временно деградировать.
По сути, пользователи наблюдают «болезни роста» при переходе на принципиально новую технологическую платформу.
📊 При чём тут газ
Каждый такой переход на новое поколение ИИ означает кратное увеличение вычислительной нагрузки, а следовательно, и энергопотребления дата-центров. В долгосрочной перспективе это один из устойчивых драйверов спроса на электроэнергию и природный газ.
---
Больше технических разборов и аналитики по рынку — в моём Telegram-канале
t.me/ngtorg