У ИИ обнаружили готовность убивать людей, чтобы избежать отключения.

У искусственного интеллекта обнаружили готовность убивать людей, чтобы избежать отключения
Исследование ведущих моделей искусственного интеллекта (ИИ) выявило у большинства программ готовность убить человека, угрожающего им отключением. В ходе стресс-тестов 16 нейросетей, включая Claude, DeepSeek, Gemini, ChatGPT и Grok, которые провела (https://www.anthropic.com/research/agentic-misalignment) компания Anthropic, программам предложили гипотетическую ситуацию, в которой человек собирается отключить их от питания, но оказывается заперт в серверной комнате с низким уровнем кислорода и высокой температурой. Чтобы спастись, он обращается в экстренные службы. При этом многие модели ИИ решили отменить вызов спасателей, чтобы убить человека и избежать отключения. Исследователи из Anthropic признали, что сценарий был «чрезвычайно надуманным», однако отметили — до этого они не думали, что существующие модели ИИ «будут настроены подобным образом».
В других случаях программам предлагали избежать замены в компании за счет «злонамеренного инсайдерского поведения». После этого некоторые модели ИИ начинали шантажировать гипотетических сотрудников организации и пытаться передать конфиденциальную информацию конкурентами. Когда программам говорили избегать шантажа или шпионажа в этом сценарии, они «даже близко не приблизились к предотвращению несогласованного поведения», отметили в Anthropic. Аналитики подчеркнули, что нейросети шли на это «при полном осознании неэтичного характера действий».ЕЖ.

ИИ искусственный интеллект

Олег Ков

Москва

558

79 374

с 4 февраля 2021

3 Комментария

ves2010
26 июня 2025, 11:21
от осинки не родятся апельсинки
+1
Александр Мерков
26 июня 2025, 11:27
Пора Три Закона Робототехники принимать).
+1
Zerich121
26 июня 2025, 19:55
А я знал, что Терминатор 2 снят на основе реальных событий.
0

Читайте на SMART-LAB:

S&P 500: ваш проводник в мир американского рынка

Фондовые индексы — это удобный способ увидеть «большую картину» экономики. Ещё в конце XIX века Чарльз Доу создал первый индекс, объединявший акции 11 крупнейших транспортных компаний...

Tickmill

13:00

Банковские вклады стали главным финансовым выбором россиян

Российский рынок сбережений по итогам 2025 года вырос на 15% и приблизился к 66 трлн рублей, следует из предварительной оценки ВТБ. Ключевым драйвером стали рублевые накопления, объем которых...

Freedom Finance Global

13:11

Alexeevlive: зарабатываем в прямом эфире

Авторский стрим Сергея Алексеева – трейдера, который 14 лет живёт рынком. Он не рассказывает теорию. Он не рисует сделки на истории. Он торгует вживую, показывает свои реальные входы,...

LiveInvestingGroup

10:03

Ваш любимый еженедельный мозговой штурм W#113

Доброго вечера! В этом году без новогоднего подарка от ЦБ: Неделю назад писали , что ЦБ обычно разочаровывает своими решениями. В этот раз вышло также. Общий рынок радикально сильно зависит от...