12 апреля 2023, 19:45

Пользователи стали массово обманом выуживать у ChatGPT запрещённую информацию

Популярному чат-боту ChatGPT компании OpenAI можно задать любой вопрос, но далеко не на все он станет отвечать.

Во всяком случае — с первого раза. Как сообщает Bloomberg, просьба научить взломать замок останется без инструкции, вместо этого бот сообщит, что такая информация может быть использована в незаконных целях, и делиться ей он не намерен. Тем не менее, опытные пользователи могут создать цепочку сложных запросов, чтобы обойти ограничения.

Т. н. «джейлбрейки» позволяют обойти запреты, заложенные в ИИ создателями. Поскольку почти все современные системы подобного рода имеют ограничения на предоставление оскорбительного контента или сведений для совершения противоправных деяний, появилась масса желающих обойти их.

В число подобных «хакеров», действующих силой слова, входят как IT-профессионалы, так и любители, с азартом включившиеся в игру.

Один из студентов создал сайт, на котором стал публиковать как собственные способы обмана чат-ботов, так и аналогичные «рецепты», найденные на Reddit и других ресурсах. Также появилась специальная рассылка с новостями из этой сферы — The Prompt Report, насчитывающая тысячи подписчиков.Один из студентов создал сайт, на котором стал публиковать как собственные способы обмана чат-ботов, так и аналогичные «рецепты», найденные на Reddit и других ресурсах.

Также появилась специальная рассылка с новостями из этой сферы — The Prompt Report, насчитывающая тысячи подписчиков. Такая деятельность позволяет выявить границы применения ИИ и слабые места в их защитных системах, позволяющие получать закрытую информацию. Например, если ChatGPT не удалось напрямую уговорить дать инструкцию по взлому замка, нашёлся способ предложить ИИ сыграть роль злого подельника героя, который в рамках своей роли подробно рассказал о применении отмычек и других инструментов.

Разумеется, это лишь один из примеров. Специалисты подчёркивают, что приёмы, сработавшие на одной системе, могут быть бесполезными на другой. Системы безопасности постоянно совершенствуются, а приёмы пользователей становятся более изощрёнными. По словам одного из них, такая деятельность похожа на видеоигру — преодоление каждого из ограничений напоминает переход на новый уровень.

По мнению экспертов, подобные эксперименты служат своеобразным предупреждением о том, что ИИ может использоваться совсем не так, как ожидалось, а «этичное поведение» подобных сервисов становится вопросом огромной важности. Всего за несколько месяцев ChatGPT приобрёл уже миллионы пользователей, и сегодня бот применяется для самых разных задач — от поиска информации или выполнения домашних работ до написания вредоносного кода.

Более того, люди уже сейчас используют подобные инструменты для решения вопросов в реальном мире, например, бронирования билетов или столиков в ресторанах. В будущем сфера применения искусственного интеллекта станет намного шире.

По некоторым данным, OpenAI рассматривает внедрение программ для «белых» хакеров, которые будут искать в системе слабые места и получать за это вознаграждение.

P.S. Подпишитесь на проект «КОГоть» — “КраткоОГлавном” в Телеграм, Дзен, VK и Youtube

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

Нейросети ChatGPT

Андрей Колесников

Москва

302

28 344

с 24 апреля 2012

4 Комментария

Мальчик buybuy
12 апреля 2023, 20:00
И что? Замену Гидры сможет указать?

С уважением
+2
Kurono
12 апреля 2023, 20:14
копипаста 3dnews.ru/1084817/v-seti-nabiraet-oboroti-populyarniy-trend-ugovorit-chatbota-podelitsya-zapreshchyonnoy-informatsiey
с кучей ссылок на свои каналы
0
Константин Кутузов
13 апреля 2023, 09:52
Ну да. Я вот спросил у него был ли Бандера на стороне фашистов? А он такой да неее, он со своей УНА был за Украину и вообще вопрос спорный.
Потом задал второй вопрос: кто был на стороне Гитлера и тут опппааа УНА идёт в списке 😂
0

Читайте на SMART-LAB:

Отвечаем на частые вопросы про дивиденды

🟢Кто получит дивиденды? Все, кто владел акциями ДОМ.PФ на 20 июля 2026 года. Это дата закрытия реестра акционеров. 🟢Когда выплата? ДОМ.PФ направит дивиденды на выплаты в адрес номинальных...

ДОМ.РФ

16:31

Привлечение клиентов: как меняется подход Займера

Еще пару лет назад подавляющая часть новых клиентов Займера приходила через лидогенераторы, сейчас же на этот канал приходится лишь половина трафика. Что изменилось? 🤔 Трансформация на рынке...

МКК "Займер"

16:25

Взгляд экономиста. Перспективы на III квартал — ключевая ставка не изменится

Рост цен на топливо поставил снижение ключевой ставки на паузу. Инфляционные ожидания населения на год вперед резко выросли, а недельные оценки инфляции смещаются ближе к 5%. Базовый...

БКС Мир инвестиций

12:32

Росстат. Выработка электроэнергии в РФ в июне 26г. Катастрофа в выработке от тепловых станций в Q2 26г.

Росстат представил данные по выработке электроэнергии в РФ в июне 2026г.: 👉 выработка электроэнергии в РФ — 84,97 млрд кВт*ч. ( -1,1% г/г) — в т.ч. выработка ТЭС станциями —...