OpenAI triển khai Chế độ Khóa để giảm rủi ro chèn lệnh trong ChatGPT

OpenAI thêm một chế độ ChatGPT nghiêm ngặt hơn cho công việc nhạy cảm
OpenAI đã giới thiệu một tính năng mới — "Chế độ Khóa" cho ChatGPT, một tính năng được thiết kế để giảm nguy cơ các cuộc tấn công chèn lệnh (prompt injection), nơi các chỉ dẫn độc hại được giấu bên trong trang web, tài liệu hoặc các nguồn nội dung khác.
Công ty cho biết chế độ này nhằm vào những cá nhân và tổ chức xử lý dữ liệu nhạy cảm và muốn có lớp bảo vệ mạnh hơn chống rò rỉ dữ liệu. Nó không dành cho mọi người, theo OpenAI, mà cho những người dùng cần kiểm soát chặt chẽ hơn về những gì ChatGPT có thể truy cập và cách nó phản hồi.
Chế độ Khóa vô hiệu hóa một số tính năng có thể mở rộng bề mặt tấn công. Người dùng sẽ không thể sử dụng duyệt web trực tiếp, nghĩa là ChatGPT chỉ có thể truy cập nội dung đã được lưu trong bộ nhớ đệm. Chế độ này cũng tắt khả năng truy xuất và hiển thị hình ảnh từ web, mặc dù chức năng tạo hình ảnh vẫn hoạt động. Ngoài ra, nghiên cứu sâu và chế độ agent cũng bị vô hiệu hóa.
OpenAI cảnh báo rằng cài đặt này không phải là giải pháp hoàn chỉnh. Ngay cả khi bật Chế độ Khóa, ChatGPT vẫn có thể bị tổn thương bởi các cuộc tấn công chèn lệnh xuất hiện trong nội dung web đã được lưu trong bộ nhớ đệm hoặc các tập tin được tải lên, và những điều đó vẫn có thể ảnh hưởng đến độ chính xác hoặc hành vi của câu trả lời. Mục tiêu của công ty, theo họ, là làm cho khả năng lộ thông tin nhạy cảm trong các tương tác đó ít xảy ra hơn.
Việc triển khai đang bắt đầu với các tài khoản ChatGPT Business tự phục vụ, cùng với các tài khoản cá nhân đủ điều kiện.
Tấn công chèn lệnh đã trở thành một mối quan ngại ngày càng tăng đối với các hệ thống AI đọc từ web và các nguồn bên ngoài khác, vì các chỉ dẫn ẩn có thể thay đổi hành vi của mô hình mà người dùng không dễ nhận ra. Chế độ mới của OpenAI là phản ứng trực tiếp trước rủi ro đó, thu hẹp các công cụ mà ChatGPT có thể dùng khi người dùng muốn một môi trường được kiểm soát hơn.
Nguồn:
Đọc thêm tin công nghệ trên Doppler VPN Blog.