Блог им. Koleso

Китайско-американская технологическая гонка. Насколько хорош Китай в области генеративного ИИ?

итайско-американская технологическая гонка. Насколько хорош Китай в области генеративного ИИ?Сегодня  Китайско-американская технологическая гонка. Насколько хорош Китай в области генеративного ИИ? 

 

Модели Китая со временем могут соперничать с американскими. Но это может не привести к экономическому или военному преимуществу.

Если вы прислушаетесь к напыщенности в Пекине и Вашингтоне, Америка и Китай вовлечены в тотальную борьбу за технологическое превосходство.

«По сути, мы считаем, что несколько избранных технологий будут играть огромное значение в предстоящее десятилетие», — заявил Джейк Салливан, советник президента Джо Байдена по национальной безопасности.

Си Цзиньпин поддержал это мнение, заявив, что «нам срочно необходимо усилить фундаментальные исследования и решить ключевые технологические проблемы», чтобы «справиться с международной конкуренцией в области науки и технологий, достичь высокого уровня самообеспечения и самосовершенствование".

Кажется, ни одна технология не волнует политиков по обе стороны Тихого океана больше, чем искусственный интеллект (ИИ).

Быстрые улучшения в способностях «генеративных» искусственных интеллектов, таких как Chatgpt, которые анализируют ценность человеческого текста, изображений или звуков в Интернете, а затем могут создавать все более сносные симулякры, только усилили навязчивую идею.

Если генеративный ИИ окажется столь трансформационным, как утверждают его сторонники, эта технология может дать тем, кто ее использует, экономическое и военное преимущество в главном геополитическом состязании 21-го века. Западные и китайские стратеги уже говорят о гонке ИИ-вооружений. Сможет ли Китай победить?

По некоторым показателям ИИ Китай вырвался вперед (см. диаграмму).

  Китайско-американская технологическая гонка. Насколько хорош Китай в области генеративного ИИ? 

Китай превзошел Америку по доле высокоцитируемых статей ИИ в 2019 году; в 2021 году 26% публикаций на конференциях ИИ во всем мире были из Китая, по сравнению с долей Америки в 17%.

Девять из десяти ведущих в мире учреждений по объему публикаций ИИ являются китайскими. Согласно одному популярному эталону, пять лучших лабораторий работают над компьютерным зрением, типом искусственного интеллекта, особенно полезным для коммунистического государства наблюдения.

Тем не менее, когда дело доходит до «основных моделей», которые придают особое значение генеративным методам, Америка уверенно лидирует (см. диаграммы 2 и 3).

  Китайско-американская технологическая гонка. Насколько хорош Китай в области генеративного ИИ?   Китайско-американская технологическая гонка. Насколько хорош Китай в области генеративного ИИ? 

Chatgpt и стоящая за ним новаторская модель, последняя версия которой называется gpt-4, являются детищем американского стартапа Openai.

Горстка других американских фирм, от небольших, таких как Anthropic или Stability ai, до гигантов, таких как Google, Meta и Microsoft (которая частично владеет Openai), имеют свои собственные мощные системы.

ernie, китайский конкурент Chatgpt, созданный Baidu, китайским гигантом интернет-поиска, многими считается менее умным.

Alibaba и Tencent, крупнейшие китайские технологические гиганты, еще не представили свои собственные генерирующие искусственные интеллекты.

Это приводит тех, кто в курсе, к выводу, что Китай отстает от Америки на два или три года в построении моделей фундамента.

Есть три причины такой низкой производительности.

Первый касается данных. Централизованная автократия должна быть в состоянии управлять многими из них — правительство, например, могло передавать массивы данных наблюдения за китайскими гражданами таким фирмам, как SenseTime или Megvii, которые с помощью ведущих китайских лабораторий компьютерного зрения, затем использовали его для разработки первоклассных систем распознавания лиц.

Это преимущество оказалось менее существенным в контексте генеративного искусственного интеллекта, поскольку базовые модели обучаются на объемных неструктурированных данных сети.

Американские строители моделей выигрывают от того, что 56% всех веб-сайтов на английском языке, тогда как только 1,5% написаны на китайском языке, согласно данным исследовательского интернет-сайта w3Techs.

Китайцы взаимодействуют с Интернетом в основном через мобильные супер-приложения, такие как WeChat и Weibo. Это «огороженные сады», поэтому большая часть их контента не индексируется поисковыми системами.

Это затрудняет восприятие этого контента моделями ИИ. Отсутствие данных может объяснить, почему Wu Dao 2.0, модель, представленная в 2021 году Пекинской академией искусственного интеллекта, поддерживаемой государством, не произвела фурора, несмотря на то, что она, возможно, была более сложной в вычислительном отношении, чем gpt-4.

Вторая причина слабых генеративных достижений Китая связана с аппаратным обеспечением. В прошлом году Америка ввела экспортный контроль над технологиями, что может дать Китаю преимущество в области искусственного интеллекта.

Они охватывают мощные микропроцессоры, используемые в центрах обработки данных облачных вычислений, где обучаются базовые модели, и инструменты для производства микросхем, которые могут позволить Китаю самостоятельно создавать такие полупроводники.

Это нанесло ущерб Китаю. Анализ 26 крупных китайских моделей, проведенный Центром управления искусственным интеллектом, британским аналитическим центром, показал, что более половины их вычислительной мощности зависели от Nvidia, американского разработчика чипов.

Некоторые отчеты предполагают, что smic, крупнейший китайский производитель чипов, выпустил прототипы всего на одно или два поколения позже, чем tsmc, тайваньский лидер отрасли, производящий чипы для Nvidia (см. диаграмму 4).

  Китайско-американская технологическая гонка. Насколько хорош Китай в области генеративного ИИ? 

Но smic, вероятно, может массово производить только чипы, которые tsmc выпускала миллионами три или четыре года назад.

Китайские фирмы искусственного интеллекта испытывают трудности с получением другого американского экспорта: ноу-хау.

Америка остается магнитом для технических талантов со всего мира; две трети экспертов по искусственному интеллекту в Америке, которые представляют доклады на главной конференции по искусственному интеллекту, родились за границей.

В 2019 году китайские инженеры составляли 27% этой избранной группы.

Многие китайские специалисты по искусственному интеллекту учились или работали в Америке, прежде чем вернуться домой. Пандемия covid-19 и рост напряженности в отношениях между Китаем и США приводят к сокращению их числа. В первой половине 2022 года Америка выдала вдвое меньше виз китайским студентам, чем за тот же период 2019 года.

Тройная нехватка — данных, оборудования и опыта — стала препятствием для Китая. Сможет ли это сдерживать китайские амбиции в области искусственного интеллекта намного дольше, это другой вопрос.

Возьмем данные.

В феврале местные власти в Пекине, где расположена почти треть китайских компаний, занимающихся искусственным интеллектом, пообещали опубликовать данные от 115 государственных организаций, предоставив разработчикам моделей 15 880 наборов данных для экспериментов.

Центральное правительство ранее сигнализировало, что хочет демонтировать обнесенные стеной сады китайских приложений, потенциально высвобождая больше данных.

Последние модели также могут переносить свое машинное обучение с одного языка на другой. Openai говорит, что gpt-4 замечательно справляется с задачами на китайском языке, несмотря на скудный китайский исходный материал в его обучающих данных.

Эрни Baidu обучался на большом количестве англоязычных данных.

В аппаратном обеспечении Китай тоже находит обходные пути. В марте газета Financial Times сообщила, что компания SenseTime, занесенная в черный список США, использовала посредников для обхода экспортного контроля. Некоторые китайские фирмы, занимающиеся искусственным интеллектом, используют процессоры Nvidia через облачные серверы в других странах.

В качестве альтернативы они могут купить больше менее продвинутых продуктов Nvidia — чтобы продолжать обслуживать огромный китайский рынок, Nvidia разработала совместимые с санкциями продукты, которые на 10–30% медленнее, чем топовые комплекты. В конечном итоге это обходится китайским клиентам дороже в расчете на единицу вычислительной мощности. Но они делают свою работу.

Китай мог бы частично смягчить нехватку чипов — и умственных способностей — с помощью моделей «с открытым исходным кодом». Внутреннее устройство таких моделей может скачать любой желающий и настроить под конкретную задачу.

К ним относятся числа, называемые «весами», которые определяют структуру модели и получаются в результате дорогостоящих тренировочных прогонов.

Исследователи из Стэнфорда использовали гири ламы, базовой модели Meta, для создания модели под названием Alpaca менее чем за 600 долларов по сравнению с примерно 100 миллионами долларов за обучение чего-то вроде gpt-4. Альпака выполняет некоторые задачи так же хорошо, как и оригинальная версия Chatgpt.

Аналогичным образом китайские лаборатории искусственного интеллекта могут воспользоваться моделями с открытым исходным кодом, которые воплощают в себе коллективный разум международных исследовательских групп.

Китай имеет форму «быстрого последователя» — его лаборатории впитали достижения из-за рубежа и быстро включили их в свои собственные модели, часто при наличии государственных ресурсов.

Известный венчурный капиталист из Силиконовой долины более прямолинеен, называя модели с открытым исходным кодом подарком Коммунистической партии.

Из-за таких соображений трудно представить, что Америка или Китай могли бы добиться непреодолимого лидерства в моделировании ИИ. Каждый из них вполне может получить ИИ с аналогичными возможностями, даже если это будет стоить Китаю больших шансов перед лицом американских санкций.

Но если гонка создателей моделей зашла в тупик, у Америки есть одно преимущество, которое может сделать ее крупным победителем в области искусственного интеллекта, — ее способность распространять передовые инновации по всей экономике.

В конце концов, именно более эффективное распространение технологий помогло Америке открыть технологическое преимущество над Советским Союзом, который в 1950-х годах выпускал в два раза больше докторов наук, чем ее американский противник.

Китай гораздо более компетентен, чем Советский Союз, в освоении новых технологий. Его финтех-платформы, телекоммуникации 5G и высокоскоростная железная дорога — все это мирового класса.

Тем не менее, эти успехи могут быть исключением, а не правилом. В частности, Китай менее успешен в развертывании облачных вычислений и программного обеспечения для бизнеса, которые дополняют искусственный интеллект.

И хотя американский экспортный контроль не может сорвать все китайское построение моделей, он сдерживает китайскую технологическую отрасль в более широком смысле, тем самым замедляя внедрение новых технологий.

Более того, китайскому бизнесу в целом, особенно малому и среднему, не хватает технологов, которые выступают проводниками распространения технологий. В экономике доминируют государственные компании, которые, как правило, не спешат и не склонны к переменам.

Китайский «Большой фонд» микросхем, который в 2014 году привлек 50 миллиардов долларов для поддержки отечественных полупроводниковых компаний, погряз в скандалах.

Многие из тысяч новых стартапов ИИ являются ИИ только по названию, навешивая ярлык, чтобы получить часть щедрых субсидий, которые государство раздает привилегированной отрасли.

Как следствие, частный сектор Китая может столкнуться с трудностями, пытаясь в полной мере воспользоваться преимуществами генеративного ИИ, особенно если Коммунистическая партия введет строгие правила, запрещающие чат-ботам говорить то, что не нравится ее цензорам. Препятствия возникнут в дополнение к более широкому подкупу Си Цзиньпином частного предпринимательства, включая продолжающееся два с половиной года подавление китайской технологической отрасли.

Хотя антитехнологическая кампания официально завершилась, она оставила глубокие шрамы, не в последнюю очередь в бизнесе искусственного интеллекта. В прошлом году частные инвестиции в китайские стартапы в сфере искусственного интеллекта составили 13,5 млрд долларов, что составляет менее одной трети суммы, вложенной их американскими конкурентами.

По данным PitchBook, поставщика данных, за первые четыре месяца 2023 года дефицит финансирования только увеличился. Независимо от того, окажется ли генеративный ИИ революционным, свободный рынок сделал ставку на то, кто извлечет из него максимальную пользу.

Оригинал

P.S. Подпишитесь на проект «КОГоть» — “КраткоОГлавном” в ТелеграмДзенVK и Youtube

    
1 комментарий
Китай едет на перекупленных мозгах Запада, поэтому всегда будет на шаг отставать.
avatar

теги блога Андрей Колесников

....все тэги



UPDONW
Новый дизайн