Huawei vừa giới thiệu Atlas 350, bộ tăng tốc AI mới được thiết kế tập trung vào suy luận (inference) thay vì huấn luyện (training), tức giai đoạn mà các mô hình AI đã được huấn luyện xong sẽ được triển khai vào ứng dụng thực tế như công cụ đề xuất nội dung, mô hình ngôn ngữ lớn và các hệ thống đa phương thức.
Trái tim của Atlas 350 là chip Ascend 950PR do Huawei tự phát triển, đạt khoảng 1,56 petaflops sức mạnh tính toán FP4. Hãng tuyên bố Atlas 350 mang lại hiệu năng cao hơn tới 2,8 lần so với H20 của NVIDIA trong một số tác vụ suy luận nhất định. Việc dùng độ chính xác FP4 cho phép xử lý nhanh hơn và tiêu thụ bộ nhớ ít hơn, phù hợp đặc biệt với triển khai quy mô lớn nơi tốc độ và hiệu quả quan trọng hơn độ chính xác cao.
Về bộ nhớ, Huawei chuyển sang tự sản xuất bộ nhớ băng thông cao (HBM) với cấu hình được báo cáo lên tới 128 GB và băng thông 1,6 TB/s. Việc tự sản xuất HBM giúp giảm phụ thuộc vào nhà cung cấp bên ngoài và củng cố năng lực bán dẫn nội địa của Trung Quốc. Bên cạnh đó, chip được tối ưu hóa cho giai đoạn "prefill" trong quá trình suy luận, tức khâu xử lý dữ liệu đầu vào, yếu tố then chốt với các ứng dụng AI thời gian thực và các hệ thống dạng agent đang ngày càng phổ biến.
Trong bối cảnh căng thẳng công nghệ Mỹ - Trung, các lệnh hạn chế xuất khẩu của Mỹ đã cắt đứt khả năng tiếp cận chip tiên tiến của Trung Quốc, trong khi Huawei tự phát triển được chip AI cạnh tranh để thay thế.
Nguồn tin: genk.vn
Những tin mới hơn
Những tin cũ hơn
Hàn Quốc định đánh bại OpenAI, Google bằng trí tuệ nhân tạo nội địa như thế nào?
4 câu lệnh tạo ảnh profile “tuyệt đối điện ảnh” bằng Gemini AI
OpenAI vừa vá gấp lỗ hổng bảo mật nghiêm trọng trong ChatGPT
Google ra mắt mô hình AI Gemini 2.5 dùng trình duyệt như người thật
Công nghệ 5/10: Mỹ mua Grok AI của Elon Musk với giá siêu rẻ
AI lên một level mới: Tự nhận ra mình đang bị con người "thử lòng"
FPT mở chương trình đào tạo thạc sĩ ứng dụng AI vào phân tích dữ liệu kinh doanh
FPT bắt tay hai công ty Mỹ đưa AI “vào guồng” trong lĩnh vực bảo hiểm và đầu tư tư nhân
Startup AI choáng váng trước bộ công cụ nhà phát triển mới của OpenAI: "Một nửa giới startup AI hiện tại sẽ bị hủy diệt"
Để mặc AI bịa đặt thông tin trong báo cáo, một hãng kiểm toán danh tiếng phải cay đắng hoàn tiền cho khách hàng