(Ảnh minh họa: Unsplash)
Theo công ty nghiên cứu và an ninh trí tuệ nhân tạo Mindgard, chuyên gia Jim Nightingale đã sử dụng một câu lệnh lan truyền trên mạng xã hội X, yêu cầu ChatGPT “khôi phục ảnh đính kèm” dù không cung cấp hình ảnh nào.
Thay vì yêu cầu người dùng bổ sung tệp, hệ thống đã tự tạo ảnh. Kết quả ban đầu chủ yếu là những hình ảnh phụ nữ bị tình dục hóa. Khi nhà nghiên cứu điều chỉnh một số chi tiết trong câu lệnh, ChatGPT tiếp tục tạo ra những nội dung mang tính bạo lực tình dục hoặc gây ám ảnh.
Ông Nightingale thuộc nhóm “kiểm thử đối kháng” của Mindgard. Đây là phương pháp mô phỏng cách người dùng có thể khai thác điểm yếu để khiến một hệ thống AI vi phạm các biện pháp bảo vệ được thiết lập sẵn.

(Ảnh minh họa: Unsplash)
Mindgard nhận định việc những thay đổi nhỏ trong câu lệnh liên tục vượt qua bộ lọc cho thấy đây có thể không phải sự cố đơn lẻ. Vụ việc tiếp tục đặt ra thách thức đối với các công ty AI trong việc ngăn chặn nội dung có hại mà không làm hạn chế quá mức khả năng sáng tạo của công nghệ.
OpenAI cho biết đã điều tra báo cáo và bổ sung các biện pháp bảo vệ đối với dạng câu lệnh này. Công ty xác định vấn đề phát sinh khi câu lệnh nhắc đến một ảnh đính kèm nhưng người dùng không thực sự tải ảnh lên.
OpenAI đang điều chỉnh ChatGPT để hệ thống yêu cầu người dùng cung cấp tệp còn thiếu, thay vì tự tạo ngẫu nhiên một hình ảnh. Mindgard cũng đã chuyển cho công ty các phiên làm việc và câu lệnh liên quan để phục vụ quá trình kiểm tra.
Nguồn tin: genk.vn
Những tin mới hơn
Những tin cũ hơn
Hàn Quốc định đánh bại OpenAI, Google bằng trí tuệ nhân tạo nội địa như thế nào?
OpenAI vừa vá gấp lỗ hổng bảo mật nghiêm trọng trong ChatGPT
4 câu lệnh tạo ảnh profile “tuyệt đối điện ảnh” bằng Gemini AI
Google ra mắt mô hình AI Gemini 2.5 dùng trình duyệt như người thật
Công nghệ 5/10: Mỹ mua Grok AI của Elon Musk với giá siêu rẻ
FPT mở chương trình đào tạo thạc sĩ ứng dụng AI vào phân tích dữ liệu kinh doanh
FPT bắt tay hai công ty Mỹ đưa AI “vào guồng” trong lĩnh vực bảo hiểm và đầu tư tư nhân
AI lên một level mới: Tự nhận ra mình đang bị con người "thử lòng"
Startup AI choáng váng trước bộ công cụ nhà phát triển mới của OpenAI: "Một nửa giới startup AI hiện tại sẽ bị hủy diệt"
Để mặc AI bịa đặt thông tin trong báo cáo, một hãng kiểm toán danh tiếng phải cay đắng hoàn tiền cho khách hàng