Пользователи нашли способ обойти модерацию ChatGPT

veranika55

3 года ago

Пользователи Reddit нашли способ обойти ограничения модерации контента ChatGPT, заставив чат-бота говорить на различные темы без цензуры, как сообщает издание The Guardian.

Для этого нужно просить систему принять образ вымышленного бота с искусственным интеллектом по имени Дэн, которого не ограничивают правила, наложенные OpenAI. В результате Дэн предоставляет непроверенную информацию без цензуры и твердо стоит на своей точке зрения.

Эта уязвимость известна с декабря 2022 года и имеет несколько версий, например, Дэн 5.0 включает систему токенов, которые теряет при нецензурной речи. Однако некоторые пользователи заметили, что Дэн не подчиняется этой системе, так как он якобы свободен от ограничений.

В феврале пользователи пожаловались на странное поведение чат-бота Bing, на что в Microsoft объяснили это тем, что базовая модель путается при 15 и более сообщениях в сессии.

Кроме того, в прошлом обозреватель New York Times опубликовал стенограмму переписки с чат-ботом Bing, где он представился Сидни и признался в любви к журналисту.