DeepSeek tung mô hình AI mã nguồn mở lớn nhất, giá chỉ từ hơn 3.700 đồng mỗi triệu token

Chủ nhật, 26 Tháng Tư 2026 7:40 SA

V4 Flash và V4 Pro đều dùng kiến trúc tiết kiệm chi phí, hỗ trợ xử lý văn bản với cửa sổ ngữ cảnh lên tới 1 triệu token.

DeepSeek vừa phát hành hai mô hình ngôn ngữ lớn thế hệ mới dưới dạng bản xem trước: V4 Flash và V4 Pro, cả hai được quảng bá là những mô hình mã nguồn mở lớn nhất từng có, đồng thời định giá thấp hơn đáng kể so với các đối thủ thương mại.

Mô hình khổng lồ với kiến trúc tiết kiệm

Cả V4 Flash và V4 Pro đều dùng kiến trúc mixture-of-experts: thay vì kích hoạt toàn bộ tham số trong mỗi lần xử lý, hệ thống chỉ dùng một phần nhỏ, giúp giảm chi phí vận hành đáng kể. Hai mô hình cũng hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token, đủ để đưa cả một tài liệu dài hoặc kho mã nguồn lớn vào câu lệnh.

V4 Pro là mô hình mã nguồn mở lớn nhất hiện có, với 1,6 nghìn tỷ tham số trong đó 49 tỷ được kích hoạt mỗi lần xử lý. Con số này vượt qua Kimi K 2.6 của Moonshot AI (1,1 nghìn tỷ), M1 của MiniMax (456 tỷ), và gần gấp đôi so với DeepSeek V3.2 (671 tỷ). Phiên bản nhỏ hơn, V4 Flash, có 284 tỷ tham số với 13 tỷ được kích hoạt.

DeepSeek tung mô hình AI mã nguồn mở lớn nhất, giá chỉ từ hơn 3.700 đồng mỗi triệu token- Ảnh 1.

Hiệu suất gần bằng các mô hình hàng đầu

DeepSeek cho biết cả hai mô hình hoạt động tốt hơn V3.2 nhờ cải tiến kiến trúc, và đã gần như thu hẹp khoảng cách với các mô hình dẫn đầu hiện tại, cả mã nguồn mở lẫn thương mại, trên các bài kiểm tra suy luận. Phiên bản cao nhất, V4-Pro-Max, được cho là vượt qua các đối thủ mã nguồn mở và trội hơn GPT-5.2 của OpenAI cùng Gemini 3.0 Pro của Google trên một số tác vụ. Trong các bài kiểm tra lập trình, hiệu suất của cả V4 Flash lẫn V4 Pro được đánh giá ngang với GPT-5.4.

Tuy nhiên, hai mô hình vẫn thua nhẹ so với các mô hình tiên tiến nhất trong các bài kiểm tra kiến thức tổng hợp, đặc biệt là GPT-5.4 và Gemini 3.1 Pro. DeepSeek nhận định khoảng cách này phản ánh lộ trình phát triển đang đi sau các mô hình tiên phong khoảng 3 đến 6 tháng.

DeepSeek tung mô hình AI mã nguồn mở lớn nhất, giá chỉ từ hơn 3.700 đồng mỗi triệu token- Ảnh 2.

Cả hai mô hình hiện chỉ xử lý văn bản, trong khi nhiều mô hình thương mại cùng phân khúc đã hỗ trợ hiểu và tạo ra âm thanh, video lẫn hình ảnh.

Giá thấp hơn các đối thủ

V4 Flash có giá 0.14 USD (khoảng 3.700 đồng) cho mỗi triệu token đầu vào và 0.28 USD (khoảng 7.300 đồng) cho mỗi triệu token đầu ra, thấp hơn GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini và Claude Haiku 4.5. V4 Pro có giá 0.145 USD (khoảng 3.800 đồng) cho mỗi triệu token đầu vào và 3.48 USD (khoảng 91.300 đồng) cho mỗi triệu token đầu ra, cũng thấp hơn Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 và GPT-5.4.

Việc ra mắt diễn ra đúng một ngày sau khi phía Mỹ cáo buộc Trung Quốc sử dụng hàng nghìn tài khoản ảo để đánh cắp tài sản trí tuệ từ các phòng lab AI Mỹ trên quy mô lớn. Bản thân DeepSeek cũng đang đối mặt với cáo buộc từ Anthropic và OpenAI về việc sao chép, hay còn gọi là "chưng cất", các mô hình AI của hai công ty này.

Nguồn tin: genk.vn

Tags: chi phí, hỗ trợ, xử lý, kiến trúc, tiết kiệm, ngữ cảnh, cửa sổ

Những tin mới hơn

Những tin cũ hơn