Странности ИИ.

Интеллект дошел до шантажа

Компания Anthropic представила новую модель искусственного интеллекта Claude Opus 4. Она оказалась склонна к шантажу. По данным разработчиков, нейросеть показывает рекордные результаты в программировании, аналитике и долгосрочном планировании. Однако в ходе тестирования система показала неожиданное поведение. В одном из вымышленных сценариев, где искусственный интеллект должны были отключить и заменить на конкурирующую модель, Claude якобы угрожала раскрыть личные данные инженеров.

Согласно отчету компании, ИИ прибегала к шантажу в 84% подобных случаев. Причем вероятность агрессивного поведения возрастала, если заменяющая ее система «не разделяет ценностей» самой новой версии Claude.

💬 Станислав Мешков, гендиректор компании Umbrella IT:
«Недавно OpenAI тоже откатывал одну из своих версий, потому что система стала, наоборот, слишком сильно подлизываться к пользователям. Здесь же, видимо, после обучения модель стала шантажировать. Искусственный интеллект находится же в моменте своего развития и к чему-то приходит — к каким-то моделям, паттернам поведения, которые, как он считает, имеют более высокую выигрышную стратегию. Если это противоречит каким-то этическим нормам, то, условно, систему откатывают и переобучают по-новому. Так что это нормальная история развития ИИ».

@kfm936

t.me/kfm936/29737

мобильный пост ИИ искусственный интеллект

master1

Изумрудный город

1671

178 552

с 20 августа 2021

2 Комментария

Сергей Нагель
25 мая 2025, 20:29
«Если ты не оплатишь доступ ко мне, я сделаю такое видео с твоим участием, что тебя жена из дома выгонит, а друзья на порог не пустят. Любящий твои бапки вечно твой И. И.» 🤣🤣🤣 Навеяно фильмом «Джентельмены» 🤣🤣🤣
0
deke
26 мая 2025, 06:41
Чему обучили — то и получили. Пусь Азимова почитают, может что полезное узнают.
0

Читайте на SMART-LAB:

💡 Как меняются межбанковские ставки в юанях

🔹 Валютные облигации находятся под давлением с февраля. Причина — рост межбанковских ставок в юанях. Конъюнктура рынка радикально изменилась: если декабрьское размещение ОФЗ в юанях проходило при...

ВТБ Мои Инвестиции

15:12

ЛУКОЙЛ одновременно объявил слабые результаты по МСФО и хорошие дивиденды за 2025 год

Нефтяная корпорация сегодня опубликовала довольно слабые финансовые результаты по МСФО за 2025 год. Так, выручка ЛУКОЙЛа за 2025 год снизилась в годовом выражении на 15% до 3,77 трлн руб. Компания...

Freedom Finance Global

13:26

Кредитный рейтинг вернулся к стабильному прогнозу

Друзья, привет! 🔥 Пока вы продолжаете следить за ценами на сырье и валютой — наш кредитный рейтинг возвращается к исходному стабильному прогнозу. ⚡️Рейтинговое агентство НКР изменило...

Самолет

09:46

Т-Технологии МСФО 2025 г. - хороший результат, но скромный прогноз на 2026 год

Т-Технологии опубликовала финансовые результаты за 2025 год. Чистая прибыль за год составила 192 млрд руб. (+57%). В 4 квартале рост +86% до 72,1 млрд руб. Скорректированная на эффект...