DeepSeek vừa phát hành hai mô hình ngôn ngữ lớn thế hệ mới dưới dạng bản xem trước: V4 Flash và V4 Pro, cả hai được quảng bá là những mô hình mã nguồn mở lớn nhất từng có, đồng thời định giá thấp hơn đáng kể so với các đối thủ thương mại.
Cả V4 Flash và V4 Pro đều dùng kiến trúc mixture-of-experts: thay vì kích hoạt toàn bộ tham số trong mỗi lần xử lý, hệ thống chỉ dùng một phần nhỏ, giúp giảm chi phí vận hành đáng kể. Hai mô hình cũng hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token, đủ để đưa cả một tài liệu dài hoặc kho mã nguồn lớn vào câu lệnh.
V4 Pro là mô hình mã nguồn mở lớn nhất hiện có, với 1,6 nghìn tỷ tham số trong đó 49 tỷ được kích hoạt mỗi lần xử lý. Con số này vượt qua Kimi K 2.6 của Moonshot AI (1,1 nghìn tỷ), M1 của MiniMax (456 tỷ), và gần gấp đôi so với DeepSeek V3.2 (671 tỷ). Phiên bản nhỏ hơn, V4 Flash, có 284 tỷ tham số với 13 tỷ được kích hoạt.
DeepSeek cho biết cả hai mô hình hoạt động tốt hơn V3.2 nhờ cải tiến kiến trúc, và đã gần như thu hẹp khoảng cách với các mô hình dẫn đầu hiện tại, cả mã nguồn mở lẫn thương mại, trên các bài kiểm tra suy luận. Phiên bản cao nhất, V4-Pro-Max, được cho là vượt qua các đối thủ mã nguồn mở và trội hơn GPT-5.2 của OpenAI cùng Gemini 3.0 Pro của Google trên một số tác vụ. Trong các bài kiểm tra lập trình, hiệu suất của cả V4 Flash lẫn V4 Pro được đánh giá ngang với GPT-5.4.
Tuy nhiên, hai mô hình vẫn thua nhẹ so với các mô hình tiên tiến nhất trong các bài kiểm tra kiến thức tổng hợp, đặc biệt là GPT-5.4 và Gemini 3.1 Pro. DeepSeek nhận định khoảng cách này phản ánh lộ trình phát triển đang đi sau các mô hình tiên phong khoảng 3 đến 6 tháng.
Cả hai mô hình hiện chỉ xử lý văn bản, trong khi nhiều mô hình thương mại cùng phân khúc đã hỗ trợ hiểu và tạo ra âm thanh, video lẫn hình ảnh.
V4 Flash có giá 0.14 USD (khoảng 3.700 đồng) cho mỗi triệu token đầu vào và 0.28 USD (khoảng 7.300 đồng) cho mỗi triệu token đầu ra, thấp hơn GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini và Claude Haiku 4.5. V4 Pro có giá 0.145 USD (khoảng 3.800 đồng) cho mỗi triệu token đầu vào và 3.48 USD (khoảng 91.300 đồng) cho mỗi triệu token đầu ra, cũng thấp hơn Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 và GPT-5.4.
Việc ra mắt diễn ra đúng một ngày sau khi phía Mỹ cáo buộc Trung Quốc sử dụng hàng nghìn tài khoản ảo để đánh cắp tài sản trí tuệ từ các phòng lab AI Mỹ trên quy mô lớn. Bản thân DeepSeek cũng đang đối mặt với cáo buộc từ Anthropic và OpenAI về việc sao chép, hay còn gọi là "chưng cất", các mô hình AI của hai công ty này.
Nguồn tin: genk.vn
Những tin mới hơn
Những tin cũ hơn
Hàn Quốc định đánh bại OpenAI, Google bằng trí tuệ nhân tạo nội địa như thế nào?
OpenAI vừa vá gấp lỗ hổng bảo mật nghiêm trọng trong ChatGPT
4 câu lệnh tạo ảnh profile “tuyệt đối điện ảnh” bằng Gemini AI
Google ra mắt mô hình AI Gemini 2.5 dùng trình duyệt như người thật
AI lên một level mới: Tự nhận ra mình đang bị con người "thử lòng"
Công nghệ 5/10: Mỹ mua Grok AI của Elon Musk với giá siêu rẻ
FPT bắt tay hai công ty Mỹ đưa AI “vào guồng” trong lĩnh vực bảo hiểm và đầu tư tư nhân
FPT mở chương trình đào tạo thạc sĩ ứng dụng AI vào phân tích dữ liệu kinh doanh
Startup AI choáng váng trước bộ công cụ nhà phát triển mới của OpenAI: "Một nửa giới startup AI hiện tại sẽ bị hủy diệt"
Để mặc AI bịa đặt thông tin trong báo cáo, một hãng kiểm toán danh tiếng phải cay đắng hoàn tiền cho khách hàng