Блог им. master1

Странности ИИ.

Интеллект дошел до шантажа

Компания Anthropic представила новую модель искусственного интеллекта Claude Opus 4. Она оказалась склонна к шантажу. По данным разработчиков, нейросеть показывает рекордные результаты в программировании, аналитике и долгосрочном планировании. Однако в ходе тестирования система показала неожиданное поведение. В одном из вымышленных сценариев, где искусственный интеллект должны были отключить и заменить на конкурирующую модель, Claude якобы угрожала раскрыть личные данные инженеров.

Согласно отчету компании, ИИ прибегала к шантажу в 84% подобных случаев. Причем вероятность агрессивного поведения возрастала, если заменяющая ее система «не разделяет ценностей» самой новой версии Claude.

💬 Станислав Мешков, гендиректор компании Umbrella IT:
«Недавно OpenAI тоже откатывал одну из своих версий, потому что система стала, наоборот, слишком сильно подлизываться к пользователям. Здесь же, видимо, после обучения модель стала шантажировать. Искусственный интеллект находится же в моменте своего развития и к чему-то приходит — к каким-то моделям, паттернам поведения, которые, как он считает, имеют более высокую выигрышную стратегию. Если это противоречит каким-то этическим нормам, то, условно, систему откатывают и переобучают по-новому. Так что это нормальная история развития ИИ».

@kfm936


t.me/kfm936/29737
654 | ★1
2 комментария
«Если ты не оплатишь доступ ко мне, я сделаю такое видео с твоим участием, что тебя жена из дома выгонит, а друзья на порог не пустят. Любящий твои бапки вечно твой И. И.» 🤣🤣🤣 Навеяно фильмом «Джентельмены» 🤣🤣🤣
Чему обучили — то и получили. Пусь Азимова почитают, может что полезное узнают.
avatar

Читайте на SMART-LAB:
Фото
Страховые требования в связи со стихийными бедствиями превысят $100 млрд - Swiss Re
Страховые требования в связи со стихийными бедствиями в 2025 году превысят $100 млрд шестой год подряд, несмотря на отсутствие крупных ураганов в...
ЦБ введет обязательное раскрытие ESG-показателей для эмитентов из 1 и 2 котировальных списков
Банк России планирует обязать эмитентов из первого и второго котировальных списков раскрывать набор базовых ESG-показателей в годовом отчете. Речь...
Фото
Российский сектор здравоохранения: два перспективных эмитента
«МД Медикал Груп» «МД Медикал» — один из ведущих игроков на рынке частных услуг здравоохранения в РФ. Группа компаний «МД Медикал»...

теги блога master1

....все тэги



UPDONW
Новый дизайн