boing
boing личный блог
Вчера в 19:07

DeepSeek выпустил нового «конкурента ChatGPT и Claude»


DeepSeek выпустил нового «конкурента ChatGPT и Claude»

Яна Закомолдина


Китайский ИИ-стартап DeepSeek выпустил в пятницу, 24 апреля, предварительную версию своей большой языковой модели V4, предоставив пользователям возможность протестировать ее новые функции и возможности. В DeepSeek обновленную версию своей ИИ-модели называют мощнейшей платформой с открытым исходным кодом, бросающей вызов конкурентам — GPT-5.4 от OpenAI и Claude Opus 4.5 от Anthropic. 

Версия V4 адаптирована для работы на чипах технологического гиганта Huawei, что подчеркивает растущие возможности Китая в ИИ-отрасли, замечает Reuters. Тесное сотрудничество с Huawei при создании V4 контрастирует с прошлым опытом DeepSeek, когда компания опиралась на технологии Nvidia, хотя стартап и не раскрыл, какие именно процессоры использовались для обучения новинки. 

Что примечательного в новой версии DeepSeek 

V4 доступна в двух вариантах — профессиональная версия «Pro» и облегченная и более дешевая «Flash». Модель оптимизирована для работы с популярными агентскими ИИ-инструментами (программами, способными самостоятельно выполнять задачи в цифровой среде), такими как Claude Code от Anthropic и OpenClaw. Подобно предыдущей версии V3 от DeepSeek, новая ИИ-модель распространяется с открытым исходным кодом, что дает разработчикам возможность свободно скачивать его, запускать на собственных мощностях и адаптировать под конкретные задачи.

DeepSeek утверждает, что V4 показывает превосходные результаты на фоне конкурентов из Китая, особенно успешно справляясь с агентскими задачами по выполнению сложных инструкций, обработкой массивов знаний и логическим выводом данных.

Среди архитектурных новшеств стартап особо выделил технологию Hybrid Attention Architecture, которая улучшает «память» ИИ в ходе длительных диалогов, а также расширение контекстного окна до 1 млн токенов, что позволяет обрабатывать целые базы кода или объемные документы одним запросом, уточняет Bloomberg. 

Контекст

Основанная в 2023 году компания DeepSeek привлекла к себе внимание в конце 2024-го, представив бесплатную ИИ-модель V3. В январе 2025 года китайский ИИ-стартап выпустил модель R1 — нейросеть с открытым исходным кодом, имитирующую процесс человеческого мышления, указывает Bloomberg. Она не только сравнялась по тестам с американскими лидерами рынка, но и вызвала панику среди инвесторов деталями своей разработки, спровоцировав триллионную распродажу акций на фондовом рынке США. Согласно заявлениям разработчиков R1, на ее создание ушло всего два месяца и менее $6 млн. Для сравнения, — обучение аналогов от OpenAI или Google, по некоторым данным 2024 года, обходилось в сумму от $100 млн до нескольких миллиардов долларов, что поставило под сомнение целесообразность колоссальных трат западных корпораций на ИИ-инфраструктуру, напоминает CNBC.

Реакция рынка

Новая модель V4 вряд ли произведет такой же фурор, как версия R1, поскольку рынок уже привык к конкурентоспособности и дешевизне китайских нейросетей, заявил в комментарии CNBC старший аналитик MorningStar Иван Су. Кроме того, теперь DeepSeek напрямую конкурирует с другими китайскими открытыми ИИ-моделями — от Alibaba и ByteDance, добавляет CNBC. «Такого позиционирования [на ИИ рынке] не было во времена R1, и это само по себе говорит о том, насколько обострилась внутренняя конкуренция», — отметил Иван Су (цитата по CNBC).

Выход новой модели DeepSeek вызвал подъем акций китайских чипмейкеров 24 апреля, поскольку инвесторы рассчитывают на рост спроса на китайское ИИ-оборудование, обращает внимание Bloomberg. Бумаги SMIC выросли в Гонконге на 9,4%, а акции Hua Hong Semiconductor взлетели более чем на 13%, в то время как конкуренты из числа разработчиков моделей, такие как Zhipu, потеряли в цене около 8%. Сейчас DeepSeek, которая не является публичной компанией, ведет переговоры о первом раунде финансирования с Alibaba и Tencent, а ее рыночная оценка может превысить $20 млрд, отмечает Bloomberg. 

Геополитический фон

Примечательно, что выход V4 состоялся на фоне очередного обострения американо-китайских отношений в сфере ИИ: 23 апреля Белый дом обвинил Китай в краже интеллектуальной собственности американских лабораторий в «промышленных масштабах», пишет Reuters. DeepSeek оказалась в центре этого скандала: Вашингтон обвиняет компанию в нарушении экспортного контроля США при закупке передовых чипов Nvidia, а компании Anthropic и OpenAI заявляют о ненадлежащем использовании их проприетарных (языковые модели с закрытым кодом) данных для обучения, уточняет агентство.

DeepSeek признает использование оборудования Nvidia, но не комментирует вопрос экспортных ограничений, настаивая, что ее модели обучаются на данных из открытых источников и не используют данные конкурентов. Посольство Китая в Вашингтоне назвало эти обвинения беспочвенными, подчеркнув приверженность Пекина защите прав интеллектуальной собственности.

24 апреля Huawei, чья линейка чипов Ascend играет ключевую роль в стремлении Китая снизить зависимость от полупроводниковых технологий США, подтвердила плотное сотрудничество с DeepSeek для обеспечения работы V4 на всей линейке своих высокопроизводительных систем. Тем не менее, пока неясно, в какой пропорции использовались чипы Huawei по сравнению с решениями от Nvidia, добавляет CNBC. Из-за экспортных ограничений США, введенных в 2022 году, китайские разработчики не могут напрямую покупать самые продвинутые ускорители Nvidia. В то же время Пекин активно подталкивает компании переходить на отечественные альтернативы, уточняет CNBC.

3 Комментария
  • Auximen
    Вчера в 19:51
    Почтал обзоры на Хабре, ничего особенного, но дёшево и огромный контекст. ИИ для бедных.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн