OpenAI lanza Modo de Bloqueo para reducir riesgos de inyección de prompts en ChatGPT

OpenAI añade un modo más estricto de ChatGPT para trabajos sensibles
OpenAI ha introducido un nuevo «Modo de Bloqueo» para ChatGPT, una función diseñada para reducir el riesgo de ataques de inyección de prompts, en los que instrucciones maliciosas se ocultan dentro de páginas web, documentos u otras fuentes de contenido.
La compañía dijo que el modo está dirigido a personas y organizaciones que manejan datos sensibles y que desean una mayor protección contra los riesgos de exfiltración de datos. No está pensado para todo el mundo, dijo OpenAI, sino para usuarios que necesitan controles más estrictos sobre a qué puede acceder ChatGPT y cómo responde.
El Modo de Bloqueo desactiva varias funciones que pueden ampliar la superficie de ataque. Los usuarios no podrán usar la navegación web en vivo, lo que significa que ChatGPT solo podrá acceder a contenido en caché. El modo también desactiva la recuperación y visualización de imágenes desde la web, aunque la generación de imágenes sigue funcionando. Además, la investigación profunda y el modo agente quedan deshabilitados.
OpenAI advirtió que la configuración no es una solución completa. Incluso con el Modo de Bloqueo activado, ChatGPT todavía puede ser vulnerable a inyecciones de prompts que aparezcan en contenido web en caché o en archivos subidos, y esos podrían seguir influyendo en la precisión o el comportamiento de una respuesta. El objetivo de la compañía, dijo, es reducir la probabilidad de que información sensible se exponga durante esas interacciones.
El despliegue comienza con cuentas ChatGPT Business de autoservicio, junto con cuentas personales elegibles.
La inyección de prompts se ha convertido en una preocupación creciente para los sistemas de IA que leen desde la web y otras fuentes externas, porque instrucciones ocultas pueden alterar el comportamiento del modelo sin ser obvias para el usuario. El nuevo modo de OpenAI es una respuesta directa a ese riesgo, limitando las herramientas disponibles para ChatGPT cuando los usuarios quieren un entorno más controlado.
Fuentes:
Lee más noticias tecnológicas en el Doppler VPN Blog.