Biểu tượng của Tập đoàn Nvidia. Ảnh: Getty Images/TTXVN
Ngày 3/12, Nvidia đã công bố dữ liệu mới nhất cho thấy máy chủ trí tuệ nhân tạo (AI) mới của hãng có khả năng nâng cao hiệu suất của các mô hình AI tiên tiến, bao gồm những mô hình phổ biến từ Trung Quốc, lên đến 10 lần so với thế hệ máy chủ trước đó.
Dữ liệu này được đưa ra trong bối cảnh ngành AI đang chuyển trọng tâm từ huấn luyện mô hình, lĩnh vực mà Nvidia hiện đang dẫn đầu, sang việc triển khai các mô hình cho hàng triệu người dùng, một lĩnh vực đang chứng kiến sự gia tăng cạnh tranh từ các đối thủ như Advanced Micro Devices (AMD) và Cerebras.
Nvidia cho biết những cải thiện này chủ yếu đến từ khả năng tích hợp một số lượng lớn các chip vào một máy chủ duy nhất và các kết nối tốc độ cao giữa chúng, một lĩnh vực mà hãng vẫn đang dẫn đầu và duy trì lợi thế rõ rệt so với các đối thủ. Máy chủ AI mới nhất của Nvidia được trang bị 72 chip hàng đầu của hãng.
Dữ liệu mà Nvidia công bố chủ yếu tập trung vào các mô hình AI sử dụng kiến trúc Mixture-of-Experts (MoE), một phương pháp giúp tối ưu hóa hoạt động của các mô hình AI bằng cách phân chia nhiệm vụ thành các phần riêng biệt và giao chúng cho các "chuyên gia" khác nhau trong mô hình xử lý. Kiến trúc MoE đã phổ biến trong năm 2025, đặc biệt sau khi DeepSeek - một công ty AI của Trung Quốc, giới thiệu một mô hình nguồn mở hiệu suất cao, yêu cầu ít thời gian huấn luyện trên các chip của Nvidia so với các đối thủ khác.
Từ đó, các công ty lớn như OpenAI (nhà sản xuất ChatGPT), Mistral của Pháp và Moonshot AI của Trung Quốc đã bắt đầu áp dụng phương pháp MoE vào các mô hình của họ. Moonshot AI đã phát hành một mô hình nguồn mở được đánh giá cao vào tháng 7 vừa qua, sử dụng kỹ thuật này.
Mặc dù Nvidia tiếp tục duy trì lợi thế trong việc triển khai mô hình AI, các đối thủ như AMD cũng đang nỗ lực không kém trong việc phát triển các sản phẩm cạnh tranh. AMD dự kiến sẽ ra mắt một máy chủ AI tương tự vào năm tới, tích hợp nhiều chip mạnh mẽ với mục tiêu cạnh tranh trực tiếp với các máy chủ của Nvidia trong lĩnh vực inference (xử lý và triển khai mô hình).
Nguồn tin: genk.vn
Những tin mới hơn
Những tin cũ hơn
Hàn Quốc định đánh bại OpenAI, Google bằng trí tuệ nhân tạo nội địa như thế nào?
OpenAI vừa vá gấp lỗ hổng bảo mật nghiêm trọng trong ChatGPT
4 câu lệnh tạo ảnh profile “tuyệt đối điện ảnh” bằng Gemini AI
Google ra mắt mô hình AI Gemini 2.5 dùng trình duyệt như người thật
AI lên một level mới: Tự nhận ra mình đang bị con người "thử lòng"
Công nghệ 5/10: Mỹ mua Grok AI của Elon Musk với giá siêu rẻ
FPT bắt tay hai công ty Mỹ đưa AI “vào guồng” trong lĩnh vực bảo hiểm và đầu tư tư nhân
FPT mở chương trình đào tạo thạc sĩ ứng dụng AI vào phân tích dữ liệu kinh doanh
Startup AI choáng váng trước bộ công cụ nhà phát triển mới của OpenAI: "Một nửa giới startup AI hiện tại sẽ bị hủy diệt"
Để mặc AI bịa đặt thông tin trong báo cáo, một hãng kiểm toán danh tiếng phải cay đắng hoàn tiền cho khách hàng