OpenAI и Microsoft соревнуются в области AGI. Эти реальные тесты покажут, когда ИИ действительно станет лучше человека.

30 июня 2025, 11:19
|
Андрей Колесников

Генеральный директор OpenAI Сэм Альтман (слева) и генеральный директор Microsoft Сатья Наделла

Ключевым элементом партнёрства OpenAI и Microsoft является достижение стартапом уровня общего искусственного интеллекта.
Microsoft получает огромную финансовую выгоду от OpenAI до тех пор, пока не будет создан AGI, что влияет на ход дискуссии.
Я придумал несколько забавных тестов, которые покажут, когда на самом деле будет достигнут AGI.

Вот какая ситуация сложилась на данный момент: пока OpenAI не достигнет уровня общего искусственного интеллекта, при котором возможности ИИ превосходят возможности человека, Microsoft получает от стартапа множество ценных технологических и финансовых преимуществ. Например, OpenAI должна делиться значительной частью своих доходов с Microsoft. Это миллиарды долларов.

Можно обоснованно предположить, что именно поэтому Сэм Альтман твердит о том, что OpenAI скоро приблизится к AGI.

Многие другие эксперты в области ИИ не говорят об этом или считают, что споры об AGI в той или иной степени беспочвенны или просто не так уж важны. Даже генеральный директор Anthropic Дарио Амодей, один из крупнейших сторонников ИИ на планете, не любит говорить об AGI.

Генеральный директор Microsoft Сатья Наделла смотрит на вещи совсем по-другому. А вы бы не стали? Если другая компания по контракту обязана выплатить вам кучу денег, если она не достигнет AGI, то вы, вероятно, не будете думать, что мы близки к AGI!

Наделла назвал стремление к AGI «взломом бенчмарков», и это очень забавно. Это относится к исследователям в области ИИ и лабораториям, разрабатывающим модели ИИ, которые хорошо показывают себя в отраслевых бенчмарках, а не в реальной жизни.

Вот официальное определение AGI от OpenAI: «высокоавтономные системы, которые превосходят людей в наиболее экономически ценной работе».

Другие эксперты определяют его немного по-другому. Но суть в том, что машины и программное обеспечение с искусственным интеллектом должны быть лучше людей в выполнении широкого спектра полезных задач. Вы уже можете обучить модель ИИ лучше справляться с одной или двумя конкретными задачами, но для достижения искусственного общего интеллекта машины должны уметь делать множество различных вещей лучше, чем люди.

Мои реальные тесты AGI

За последние несколько месяцев я разработал несколько реальных тестов, чтобы проверить, достигли ли мы AGI. Это забавные или раздражающие повседневные вещи, которые должны работать в мире AGI, но пока не работают для меня. Я также опросил читателей моего информационного бюллетеня Tech Memo и обратился к своей сети источников за забавными предложениями.

Вот мои реальные тесты, которые докажут, что мы достигли AGI:

Отделы по связям с общественностью OpenAI и Anthropic используют собственные технологии искусственного интеллекта, чтобы отвечать на вопросы каждого журналиста. Прямо сейчас эти компании нанимают множество журналистов-людей и других специалистов по коммуникациям, чтобы они отвечали на шквал вопросов репортёров об искусственном интеллекте и будущем. Когда я обращаюсь в эти компании, мне каждый раз отвечают люди. Это неприемлемо! Если это не изменится, мы не достигнем AGI.
Это предложение от сотрудника хедж-фонда, и мне оно нравится: «Пожалуйста, пожалуйста, может ли моя система электронной почты Microsoft Outlook перестать скрывать важные письма, пропуская при этом спам?» Похоже, что Microsoft и OpenAI могли бы решить эту проблему с помощью своих технологий искусственного интеллекта. Я пока не видел решения.
Кстати, может, кто-нибудь попросит Cactus Warehouse перестать присылать мне каждые два дня предложения о 20-процентной скидке на суккуленты? Я всего один раз купил у вас кактус! Ну же, ИИ, это наверняка можно решить!
Моя Tesla Model 3 Performance 2024 года попадает в выбоины в FSD. Неудивительно, что на этих электромобилях так часто приходится менять шины. Как человек, я могу гораздо лучше объезжать выбоины. Илон, вызов AGI брошен. Займись этим сейчас.
Могут ли модели ИИ и чат-боты делать ценные прогнозы на будущее или они в основном просто пересказывают то, что уже известно в интернете? Я недавно протестировал это, сразу после того, как США нанесли удар по Ирану. Способность ChatGPT выбирать акции была проверена в сравнении с одним аналитиком-человеком. Ознакомьтесь с результатами здесь. TL;DR: в этом вопросе мы далеки от AGI.
Есть отличная реклама Google Gemini TV, в которой ребёнок помогает своему отцу собрать баскетбольную сетку. Сын использует телефон на Android, чтобы спросить у Gemini инструкции, и направляет камеру на своего бедного отца, который возится с деталями и инструментами. Очень впечатляет, когда видишь, как Gemini находит в интернете руководство по сборке, просто «увидев», что происходит в реальном времени. Однако для того, чтобы AGI был здесь, ИИ должен просто собрать эту чёртову сетку самостоятельно. Я могу сидеть и раздражающе зачитывать инструкции, пока кто-то другой мучается с кропотливой сборкой — мы все так можем.

Да, я знаю, что эти тесты кажутся немного глупыми, но тесты ИИ — это не реальный мир, и в них довольно легко играть.

Этот последний тест с баскетбольной сеткой особенно показателен для меня. Если бы система искусственного интеллекта и программное обеспечение могли собрать баскетбольную сетку, это могло бы произойти в ближайшее время. Но если бы та же система могла выполнять множество других действий в физическом мире лучше, чем люди? Это очень сложно и, вероятно, невозможно в течение очень долгого времени.

По мере того как OpenAI и Microsoft пытаются уладить свои разногласия, компании могут привлекать экспертов для оценки того, достиг ли стартап уровня AGI, согласно условиям их существующего контракта, сообщает The Information. Я с радостью стану здесь экспертом-консультантом. Сэм и Сатья, дайте мне знать, если вам нужна помощь!

На данный момент я оставлю последнее слово за настоящим экспертом в области ИИ. Константин Мищенко, научный сотрудник Meta, занимающийся исследованиями в области ИИ, недавно написал об этом в Твиттере, сославшись на блог другого уважаемого эксперта в этой области, Сергея Левина:

«Хотя LLM научились имитировать интеллект на основе данных из интернета, им никогда не приходилось жить и приобретать этот интеллект напрямую. У них нет основного алгоритма для обучения на основе опыта. Им нужен человек, который сделает это за них», — написал Мищенко, имея в виду модели ИИ, известные как большие языковые модели.

«Это говорит, по крайней мере, мне, что разрыв между языковыми моделями и настоящим интеллектом может быть шире, чем мы думаем. Несмотря на все разговоры о том, что ИИ уже здесь или появится в следующем году, я не могу избавиться от ощущения, что это невозможно, пока мы не придумаем что-то лучше, чем языковая модель, имитирующая наше представление о том, как должен выглядеть ИИ», — заключил он.

Оригинал

Читайте еще:

Что нужно знать о Tor и как им пользоваться. Подробно и просто рассказываем о популярном и надежном способе обхода

Предкризисное настроение. Четыре отрасли российской экономики, которые рухнут первыми от высоких ставок и снижения спроса

Подпишитесь на канал "Жизнь Дурова: ЗОЖ, деньги, ИТ" — все самое главное о здоровье, технологиях и деньгах

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

обсудить на форуме:
Microsoft

259

1 комментарий

есть крайне простой тест на ии

это способность читать текст с выражением

и как ни странно ии разгребет все архивы всех стран и напишет настоящую историю человечества… а не бред из учебников