OpenAI lança o Lockdown Mode para reduzir riscos de prompt injection no ChatGPT

OpenAI adiciona um modo mais rigoroso ao ChatGPT para trabalhos sensíveis
OpenAI introduziu um novo “Lockdown Mode” para o ChatGPT, um recurso projetado para reduzir o risco de ataques de injeção de prompt, onde instruções maliciosas ficam escondidas dentro de páginas da web, documentos ou outras fontes de conteúdo.
A empresa disse que o modo é voltado para pessoas e organizações que lidam com dados sensíveis e que desejam proteção mais rígida contra riscos de exfiltração de dados. Não é pensado para todos, disse a OpenAI, mas para usuários que precisam de controles mais restritos sobre o que o ChatGPT pode acessar e como ele responde.
O Lockdown Mode desabilita vários recursos que podem ampliar a superfície de ataque. Usuários não poderão usar a navegação web ao vivo, o que significa que o ChatGPT só poderá acessar conteúdo em cache. O modo também desativa a recuperação e a exibição de imagens da web, embora a geração de imagens ainda funcione. Além disso, pesquisa aprofundada e modo agente são desativados.
A OpenAI alertou que a configuração não é uma solução completa. Mesmo com o Lockdown Mode ativado, o ChatGPT ainda pode ficar vulnerável a injeções de prompt que apareçam em conteúdo web em cache ou em arquivos carregados, e isso ainda pode influenciar a precisão ou o comportamento de uma resposta. O objetivo da empresa, disse, é tornar menos provável que informações sensíveis sejam expostas durante essas interações.
O lançamento começará com contas do ChatGPT Business de autoatendimento, junto com contas pessoais elegíveis.
A injeção de prompt se tornou uma preocupação crescente para sistemas de IA que leem da web e de outras fontes externas, porque instruções ocultas podem alterar o comportamento do modelo sem serem óbvias para o usuário. O novo modo da OpenAI é uma resposta direta a esse risco, reduzindo as ferramentas disponíveis ao ChatGPT quando os usuários desejam um ambiente mais controlado.
Fontes:
Leia mais notícias de tecnologia no Doppler VPN Blog.