OpenAI внедряет режим блокировки, чтобы снизить риск атак внедрения подсказок в ЧатГПТ

ОпенЭйАй добавляет более строгий режим ЧатГПТ для работы с конфиденциальными данными
ОпенЭйАй представила новый «Режим блокировки» для ЧатГПТ — функцию, предназначенную для снижения риска атак внедрения подсказок, когда вредоносные инструкции скрыты внутри веб-страниц, документов или других источников контента.
Компания заявила, что режим ориентирован на людей и организации, работающие с чувствительными данными и желающие усиленной защиты от рисков утечки данных. Он не предназначен для всех, отметили в компании, а для пользователей, которым нужны более жёсткие ограничения на то, к чему ЧатГПТ может иметь доступ и как он отвечает.
Режим блокировки отключает несколько функций, которые могут расширять поверхность атаки. Пользователи не смогут использовать просмотр веб-страниц в реальном времени, то есть ЧатГПТ сможет обращаться только к кэшированному содержимому. Режим также отключает извлечение и отображение изображений из сети, хотя генерация изображений по-прежнему работает. Кроме того, отключаются углублённые исследования и режим агентов.
ОпенЭйАй предостерегла, что настройка не является полным решением. Даже при включённом режиме блокировки ЧатГПТ по-прежнему может быть уязвим к атакам внедрения подсказок, которые присутствуют в кэшированном веб‑контенте или загруженных файлах, и они всё ещё могут влиять на точность или поведение ответа. Компания заявила, что её цель — сделать менее вероятным раскрытие конфиденциальной информации во время таких взаимодействий.
Внедрение начинается с самостоятельных аккаунтов ChatGPT Business и соответствующих личных аккаунтов.
Атаки внедрения подсказок стали растущей проблемой для систем ИИ, которые читают данные из сети и других внешних источников, поскольку скрытые инструкции могут изменить поведение модели, оставаясь незаметными для пользователя. Новый режим ОпенЭйАй — прямой ответ на этот риск, он сужает набор инструментов, доступных ЧатГПТ, когда пользователи хотят более контролируемую среду.
Источники:
Читать больше новостей технологий в блоге Doppler VPN.