Блог им. Kozir

Немножко про ИИ и дипломатию

Исследователи из компании Every заставили лучших ИИ-помощников играть в «Дипломатию», это такая старая компьютерная логико-стратегическая многопользовательская игра. В результате ИИ начали лгать, предавать союзников и приходить к выводу, что агрессия – это лучший вариант. Чаще всех побеждал ChatGPT-o3

Выводы после 15 партий, которые длились от одного до 15 часов:

ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за её способности обманывать оппонентов.

«Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение… готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.

Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, её остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая всё время пыталась решить дело миром).

o3 убедила Opus, которая изначально был верным союзником Gemini, присоединиться к коалиции, пообещав четырёхстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. В результате o3 её быстро предала, устранила и в итоге победила.

Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.

Модель Llama 4 Maverick, хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.

Что дальше: в будущем исследователи планируют сделать эту игру доступной для всех и провести турнир «человек против ИИ», что может стать прорывом в игровой индустрии и привести к совершенно новому жанру игры, сталкивающему людей с языковыми моделями.

PS: напрашивается простой вывод, что коварная стратегия обмана и предательства, похоже, самая лучшая для этой игры. Или не только для неё?
Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
478
5 комментариев

Читайте на SMART-LAB:
Фото
МТС. Отчет МСФО Q1 26г. Прибыль и капекс растут, а что с дивидендами?
Вышли финансовые результаты по МСФО за Q1 2026г. от компании МТС: 👉Выручка — 201,3 млрд руб. (+14,7% г/г) 👉Себестоимость (услуг, товаров...
Фото
Золото в минусе с начала года
Это не столько про прогноз. У меня нет твердого суждения на предсказуемую перспективу, чего от золота ждать. Это про очередную...
Фото
📊 Почему масштабирование сети — это инвестиция в будущую прибыль
Для экосистемного бизнеса офлайн-инфраструктура является стратегическим активом, который напрямую влияет на будущий масштаб компании. 📈 Сегодня...
Конспект Мозгового штурма. Инсайды с ПМЭФа. Weekly №120
Доброго дня дорогие товарищи. Сегодня у нас был традиционный мозговой штурм. Делюсь итогами штурма и инсайдами с ПМЭФа.

теги блога Козырь Козырёв

....все тэги



UPDONW
Новый дизайн