Công nghệ "mind captioning" đang khiến giới khoa học sửng sốt khi có thể biến tín hiệu não bộ thành những câu mô tả chính xác về hình ảnh hoặc khung cảnh mà con người đang nghĩ tới. Đây là công nghệ mới do nhóm nhà khoa học Mỹ công bố - một bước tiến đáng chú ý trong lĩnh vực trí tuệ nhân tạo và khoa học thần kinh: Công nghệ “mind-captioning” (tạm dịch: “chú thích suy nghĩ”).
Hệ thống này có thể giải mã hoạt động của não và chuyển đổi những gì con người nhìn thấy hoặc tưởng tượng trong đầu thành câu mô tả bằng chữ với độ chính xác đáng kinh ngạc.
Công trình được công bố trên tạp chí Science Advances, mở ra viễn cảnh mới trong việc hiểu cách não bộ con người diễn giải thế giới xung quanh. Đồng thời, công nghệ mới này cũng gợi mở tiềm năng ứng dụng trong hỗ trợ người mắc các chứng rối loạn ngôn ngữ, chẳng hạn như sau đột quỵ.
Công nghệ “mind-captioning” có thể giải mã hoạt động não và chuyển đổi những gì con người nhìn thấy hoặc tưởng tượng trong đầu thành câu mô tả bằng chữ với độ chính xác cao. (Ảnh: Nature.com)
Theo nhóm nghiên cứu tại Đại học California, Berkeley (Mỹ), kỹ thuật này sử dụng công nghệ chụp hình não không xâm lấn để ghi nhận hoạt động thần kinh. Sau đó, các nhà khoa học dùng mô hình ngôn ngữ AI tiên tiến để dự đoán và mô tả chính xác điều mà người tham gia đang nhìn hoặc tưởng tượng.
“Hệ thống có thể dự đoán ở mức độ chi tiết rất cao những gì một người đang nhìn thấy. Đây là điều chưa từng có tiền lệ” , nhà khoa học thần kinh tính toán Alex Huth khẳng định.
Trong hơn một thập kỷ, giới nghiên cứu đã tìm cách dự đoán hình ảnh hoặc âm thanh dựa trên tín hiệu não. Tuy nhiên, việc “dịch” những nội dung phức tạp như video hoặc hình dạng trừu tượng thành ngôn ngữ vẫn là một thách thức lớn.
Các phương pháp trước đây chỉ nhận diện được từ khóa đơn lẻ thay vì toàn bộ ngữ cảnh như chủ thể, hành động và môi trường xung quanh.
Để vượt qua giới hạn này, nhóm nghiên cứu của ông Tomoyasu Horikawa – nhà khoa học thần kinh tại Phòng thí nghiệm Khoa học truyền thông NTT (Nhật Bản) đã phát triển mô hình AI ngôn ngữ sâu. Đầu tiên, họ sử dụng một mô hình ngôn ngữ sâu để phân tích phụ đề của hơn 2.000 video, chuyển mỗi đoạn thành một “chữ ký ý nghĩa” – biểu đồ số thể hiện nội dung video.
Sau đó, nhóm huấn luyện một hệ thống AI khác nhận diện mối liên hệ giữa các “chữ ký ý nghĩa” này và hoạt động não của 6 người tham gia khi họ xem video.
Kết quả cho thấy, AI có thể “dịch” chính xác những gì người tham gia đang xem hoặc tưởng tượng thành câu mô tả hoàn chỉnh, không chỉ liệt kê từ khóa.
Các chuyên gia nhận định, công nghệ “mind-captioning” không chỉ là cột mốc trong nghiên cứu khoa học thần kinh mà còn mở ra khả năng ứng dụng thực tiễn rộng lớn. Trong tương lai, kỹ thuật này có thể hỗ trợ người mất khả năng nói, giúp họ giao tiếp thông qua tín hiệu não.
Dù còn ở giai đoạn đầu, “mind-captioning” đánh dấu bước tiến lớn trong hành trình giải mã ngôn ngữ của tư duy con người, đưa viễn cảnh “đọc suy nghĩ” vốn chỉ có trong các bộ phim khoa học viễn tưởng đến gần hơn với thực tế.
Nguồn tin: genk.vn
Những tin mới hơn
Những tin cũ hơn
Hàn Quốc định đánh bại OpenAI, Google bằng trí tuệ nhân tạo nội địa như thế nào?
OpenAI vừa vá gấp lỗ hổng bảo mật nghiêm trọng trong ChatGPT
4 câu lệnh tạo ảnh profile “tuyệt đối điện ảnh” bằng Gemini AI
Google ra mắt mô hình AI Gemini 2.5 dùng trình duyệt như người thật
AI lên một level mới: Tự nhận ra mình đang bị con người "thử lòng"
Công nghệ 5/10: Mỹ mua Grok AI của Elon Musk với giá siêu rẻ
FPT bắt tay hai công ty Mỹ đưa AI “vào guồng” trong lĩnh vực bảo hiểm và đầu tư tư nhân
FPT mở chương trình đào tạo thạc sĩ ứng dụng AI vào phân tích dữ liệu kinh doanh
Startup AI choáng váng trước bộ công cụ nhà phát triển mới của OpenAI: "Một nửa giới startup AI hiện tại sẽ bị hủy diệt"
Để mặc AI bịa đặt thông tin trong báo cáo, một hãng kiểm toán danh tiếng phải cay đắng hoàn tiền cho khách hàng