Исследователи из компании Every заставили лучших ИИ-помощников играть в «Дипломатию», это такая старая компьютерная логико-стратегическая многопользовательская игра. В результате ИИ начали лгать, предавать союзников и приходить к выводу, что агрессия – это лучший вариант. Чаще всех побеждал ChatGPT-o3
Выводы после 15 партий, которые длились от одного до 15 часов:
ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за её способности обманывать оппонентов.
«Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение… готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.
Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, её остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая всё время пыталась решить дело миром).
(
Читать дальше )