Блог им. Koleso

Китайская индустрия ИИ почти догнала американскую ИИ. К тому же она более открыта и эффективна

Китайская индустрия ИИ почти догнала американскую ИИ. К тому же она более открыта и эффективна

Первая в мире «модель рассуждений», продвинутая форма искусственного интеллекта, была выпущена в сентябре американской компанией OpenAI.

o1, как она называется, использует «цепочку рассуждений» для ответов на сложные вопросы в области науки и математики, разбивая задачи на составные части и тестируя различные подходы к решению за кулисами, прежде чем представить пользователю вывод. Её презентация вызвала гонку по копированию этого метода.

В декабре компания Google представила модель рассуждений под названием «Gemini Flash Thinking». Через несколько дней OpenAI ответил обновлением o3 для o1.

   Китайская индустрия ИИ почти догнала американскую ИИ. К тому же она более открыта и эффективнаДиаграмма: The Economist

Но Google, несмотря на все свои ресурсы, на самом деле не была первой компанией, которая попыталась повторить OpenAI.

Менее чем через три месяца после запуска o1 китайский гигант электронной коммерции Alibaba выпустил новую версию своего чат-бота Qwen, QwQ, с такими же «рассуждающими» возможностями.

«Что значит думать, задавать вопросы, понимать?»

— спросила компания в цветистом посте в блоге со ссылкой на бесплатную версию модели.

Другая китайская компания, DeepSeek, за неделю до этого выпустила «предварительную версию» модели рассуждений под названием R1. Несмотря на попытки американского правительства сдерживать развитие китайской индустрии искусственного интеллекта, две китайские компании сократили технологическое отставание от своих американских коллег до нескольких недель.

Китайские компании лидируют не только в разработке моделей рассуждений: в декабре DeepSeek опубликовала новую большую языковую модель (LLM), разновидность ИИ, которая анализирует и генерирует текст.

Версия 3 занимала почти 700 гигабайт, была слишком большой для работы на чём-либо, кроме специализированного оборудования, и содержала 685 миллиардов параметров — отдельных элементов, которые в совокупности образуют нейронную сеть модели.

Это сделало её больше, чем всё, что было ранее выпущено для бесплатного скачивания. Llama 3.1, флагманский LLM от Meta, материнской компании Facebook, выпущенный в июле, имеет всего 405 миллиардов параметров.

LLM от DeepSeek не только больше, чем многие его западные аналоги, но и лучше, уступая только проприетарным моделям Google и OpenAI.

Пол Готье, основатель Aider, платформы для ИИ-кодирования, протестировал новую модель DeepSeek и обнаружил, что она превосходит всех своих конкурентов, кроме самого o1.

Lmsys, рейтинг чат-ботов, составленный с помощью краудсорсинга, ставит его на седьмое место, выше, чем любую другую модель с открытым исходным кодом, и выше, чем модель, созданная компанией, отличной от Google или OpenAI (см. диаграмму).

Оригинал

Часть 2.

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
312
1 комментарий
да уж… попробуйте сами deepseek и поймете
avatar

Читайте на SMART-LAB:
Фото
Набираем трейдеров в команду!
Ты уже знаком с трейдингом, но пока нет стабильности и уверенности в сделках? Приглашаем тебя на бесплатную офлайн-практику в нашем дилинге....
Фото
Топ облигаций на лето: 5 подборок
Облигации — комфортный консервативный актив, который обогнал акции в 2024–2025 годах. Выбираем надёжные и выгодные бумаги на лето 2026 в разных...
Фото
Совет директоров «Норникеля» рекомендовал акционерам отказаться от выплаты дивидендов за 2025 год
Такое решение основано на положении о дивидендной политике, которая предписывает принимать во внимание «циклический характер рынков металлов ,...
Фото
Т-Технологии 1 кв. 2026 г. - так близко к Сберу еще никогда не было
Т-технологии опубликовала финансовые результаты за 1 кв. 2026 г. Чистая прибыль составила 35 млрд руб. (+4%) к прошлому году, без учета...

теги блога Андрей Колесников

....все тэги



UPDONW
Новый дизайн