Блог им. Kozir

Немножко про ИИ и дипломатию

Исследователи из компании Every заставили лучших ИИ-помощников играть в «Дипломатию», это такая старая компьютерная логико-стратегическая многопользовательская игра. В результате ИИ начали лгать, предавать союзников и приходить к выводу, что агрессия – это лучший вариант. Чаще всех побеждал ChatGPT-o3

Выводы после 15 партий, которые длились от одного до 15 часов:

ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за её способности обманывать оппонентов.

«Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение… готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.

Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, её остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая всё время пыталась решить дело миром).

o3 убедила Opus, которая изначально был верным союзником Gemini, присоединиться к коалиции, пообещав четырёхстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. В результате o3 её быстро предала, устранила и в итоге победила.

Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.

Модель Llama 4 Maverick, хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.

Что дальше: в будущем исследователи планируют сделать эту игру доступной для всех и провести турнир «человек против ИИ», что может стать прорывом в игровой индустрии и привести к совершенно новому жанру игры, сталкивающему людей с языковыми моделями.

PS: напрашивается простой вывод, что коварная стратегия обмана и предательства, похоже, самая лучшая для этой игры. Или не только для неё?
473
5 комментариев

Читайте на SMART-LAB:
Фото
«Норникель»: есть ли потенциал?
Конфликт на Ближнем Востоке привел к коррекции цен на никель, медь и металлы платиновой группы, так как создал угрозу снижения...
Фото
Стратегия на II квартал 2026 года. Взгляд на облигации
Игорь Галактионов Инвестиционная Стратегия на II квартал 2026 года предлагает ориентиры для управления портфелем. Ведущие аналитики...
🖥 В2В-РТС в гостях у Market Power
Уже 10 апреля — то есть завтра! — мы поговорим с компанией перед IPO.      🔶 Обсудим: • Планы на IPO и мотивацию: зачем компания выходит на...
Фото
Кто сейчас самый дешевый сбыт? Сводный пост по сбытовым компаниям по отчетам РСБУ за 2025г.
Волгоградэнергосбыт Ставропольэнергосбыт Самараэнерго Мордовэнергосбыт Пермэнергосбыт Новосибирскэнергосбыт...

теги блога Козырь Козырёв

....все тэги



UPDONW
Новый дизайн