Mô hình tạo ảnh mới Images 2.0 trên ChatGPT của OpenAI đang thu hút sự chú ý của giới công nghệ và cả người dùng tại Việt Nam khi lần đầu tiên văn bản trong ảnh được xử lý gần như chính xác, ngay cả với tiếng Việt, khắc phục điểm yếu cố hữu của các thế hệ AI trước đây.
Nếu như cách đây 2 năm, các công cụ như DALL-E 3 thường xuyên mắc lỗi chính tả, thậm chí "bịa" ra từ ngữ khi tạo hình ảnh chứa văn bản, thì nay Images 2.0 có thể tạo ra một thực đơn nhà hàng hoàn chỉnh với nội dung rõ ràng, tự nhiên, khó phân biệt với sản phẩm do con người thiết kế.

Tạo một menu nhà hàng bằng tiếng Việt bởi ChatGPT
Qua thử nghiệm thực tế với tiếng Việt, chúng tôi ghi nhận so với phiên bản Image 1.5 ra mắt cuối năm ngoái, ChatGPT tích hợp Images 2.0 cho khả năng tạo ảnh nhanh hơn và độ chính xác cao hơn.
Văn bản tiếng Việt hiển thị gần như không gặp lỗi chính tả hay sai lệch ký tự, kể cả với nội dung dài. Ngoài ra, người dùng có thể tùy chọn nhiều tỉ lệ khung hình như vuông, chân dung, ngang hoặc màn ảnh rộng.
Theo phản hồi từ cộng đồng, Images 2.0 của OpenAI đang tạo áp lực cạnh tranh đáng kể lên các đối thủ, trong đó có Nano Banana Pro của Google.
"Sau khi Google ra Nano Banana Pro thì cuối cùng ChatGPT cũng tham gia cuộc chơi với Image 2.0. Nó hiểu tiếng Việt rõ hơn, cấu trúc câu lệnh chi tiết hơn. Kiểu này mấy anh làm menu dạo tha hồ mà nhận đơn" - một người dùng mạng xã hội nói vui.
Dù chưa công bố chi tiết công nghệ, OpenAI cho biết Images 2.0 được tích hợp khả năng "tư duy", có thể tự kiểm tra kết quả, tìm kiếm thông tin và tạo nhiều biến thể hình ảnh từ một yêu cầu.
Nhờ đó, mô hình có thể thiết kế các sản phẩm phức tạp như ấn phẩm marketing, giao diện hoặc truyện tranh nhiều khung với độ chi tiết cao.
Bên cạnh đó, khả năng hiển thị chữ ngoài bảng chữ cái Latin như tiếng Nhật, Hàn hay Hindi cũng được cải thiện rõ rệt. Độ phân giải đầu ra có thể đạt tới 2K, giúp tái hiện tốt các chi tiết nhỏ, biểu tượng và bố cục dày đặc - những yếu tố từng là hạn chế lớn của AI tạo ảnh trước đây.

Người dùng hài lòng với menu được tạo bởi Images 2.0 của OpenAI
Images 2.0 đã được cung cấp cho toàn bộ người dùng ChatGPT và Codex. Trong đó, người dùng trả phí có thể tiếp cận thêm các tùy chọn nâng cao. Đồng thời, OpenAI cũng mở API gpt-image-2 với mức giá phụ thuộc vào chất lượng và độ phân giải đầu ra.
Với những cải tiến này, tình trạng sai lỗi chính tả khi tạo ảnh bằng AI gần như đã được khắc phục, mở ra nhiều ứng dụng thực tiễn trong thiết kế và truyền thông.

Không còn xảy ra hiện tượng sai lỗi chính tả khi tạo bởi AI
Nguồn tin: genk.vn
Những tin mới hơn
Những tin cũ hơn
Hàn Quốc định đánh bại OpenAI, Google bằng trí tuệ nhân tạo nội địa như thế nào?
OpenAI vừa vá gấp lỗ hổng bảo mật nghiêm trọng trong ChatGPT
4 câu lệnh tạo ảnh profile “tuyệt đối điện ảnh” bằng Gemini AI
Google ra mắt mô hình AI Gemini 2.5 dùng trình duyệt như người thật
AI lên một level mới: Tự nhận ra mình đang bị con người "thử lòng"
Công nghệ 5/10: Mỹ mua Grok AI của Elon Musk với giá siêu rẻ
FPT bắt tay hai công ty Mỹ đưa AI “vào guồng” trong lĩnh vực bảo hiểm và đầu tư tư nhân
FPT mở chương trình đào tạo thạc sĩ ứng dụng AI vào phân tích dữ liệu kinh doanh
Startup AI choáng váng trước bộ công cụ nhà phát triển mới của OpenAI: "Một nửa giới startup AI hiện tại sẽ bị hủy diệt"
Để mặc AI bịa đặt thông tin trong báo cáo, một hãng kiểm toán danh tiếng phải cay đắng hoàn tiền cho khách hàng