Meta đang tăng cường nỗ lực phát triển chip AI tùy chỉnh (ASIC) của riêng mình, tập trung vào hiệu suất suy luận. Nhu cầu điện toán khổng lồ đã buộc các nhà cung cấp dịch vụ siêu quy mô (hyperscaler) phải tìm kiếm các giải pháp thay thế cho GPU truyền thống từ các nhà sản xuất như NVIDIA. Google và Amazon là những ví dụ điển hình về thành công của việc phát triển chip ASIC tối ưu hóa cho khối lượng công việc nội bộ, và Meta đang đi theo con đường tương tự.
Trong một bài đăng blog gần đây, Meta tiết lộ lộ trình MTIA của họ đang đi đúng hướng với tốc độ phát triển cực kỳ nhanh chóng. Công ty dự định triển khai bốn thế hệ chip mới thuộc dòng MTIA trong vòng hai năm tới, mỗi loại nhắm mục tiêu vào một khối lượng công việc cụ thể, từ huấn luyện đến suy luận GenAI.
Bắt đầu với MTIA 300, chip này chủ yếu được thiết kế cho các tác vụ xếp hạng và đề xuất, với mạng lưới mở rộng quy mô đạt 200 GB/s. Chip MTIA 300 bao gồm một chiplet điện toán và hai chiplet mạng, cùng với nhiều ngăn xếp HBM với dung lượng 216 GB và băng thông 6,12 TB/s. Meta cho biết MTIA 300 đã đặt nền móng cho MTIA 400 tiên tiến hơn, có khả năng cạnh tranh cao hơn.
MTIA 400 mang lại hiệu suất FP8 FLOPS cao hơn 400% và băng thông HBM cao hơn 51% so với thế hệ trước, với trọng tâm là hiệu suất thô. Chip này có cấu hình mở rộng quy mô 72 chip được kết nối thông qua một mặt phẳng chuyển mạch. Thế hệ chip này đang được triển khai, cho thấy Meta hài lòng với hiệu suất cạnh tranh của nó. Các tùy chọn thú vị hơn là MTIA 450 và MTIA 500, được thiết kế trực tiếp cho nhu cầu suy luận bằng cách tập trung vào dung lượng và băng thông HBM.
Meta cho biết họ có kế hoạch cạnh tranh với các giải pháp thương mại bằng cách duy trì chu kỳ sản phẩm nhanh chóng để theo kịp nhu cầu điện toán đang thay đổi. Chu kỳ nhanh này có thể thực hiện được nhờ khả năng mô-đun chiplet của Meta, cho phép họ hoán đổi các chiplet riêng lẻ giữa các thế hệ mà không cần phải cải tổ toàn bộ cơ sở hạ tầng. Với MTIA 450 và 500, Meta đang áp dụng cách tiếp cận ưu tiên suy luận để tạo sự khác biệt so với các GPU tiêu chuẩn.
Mặc dù thỏa thuận gần đây của Meta với NVIDIA và các báo cáo khác có thể gợi ý rằng công ty có thể từ bỏ nỗ lực chip tùy chỉnh, nhưng Meta dường như tự tin vào khả năng kỹ thuật của mình. Công ty đã áp dụng một chiến lược khá mạnh mẽ, với tất cả các thế hệ chip MTIA đã thảo luận sẽ được triển khai vào năm 2026, giúp Meta vượt qua nút thắt cổ chai về điện toán.
Nguồn tin: genk.vn
Những tin mới hơn
Những tin cũ hơn
Hàn Quốc định đánh bại OpenAI, Google bằng trí tuệ nhân tạo nội địa như thế nào?
OpenAI vừa vá gấp lỗ hổng bảo mật nghiêm trọng trong ChatGPT
4 câu lệnh tạo ảnh profile “tuyệt đối điện ảnh” bằng Gemini AI
Google ra mắt mô hình AI Gemini 2.5 dùng trình duyệt như người thật
AI lên một level mới: Tự nhận ra mình đang bị con người "thử lòng"
Công nghệ 5/10: Mỹ mua Grok AI của Elon Musk với giá siêu rẻ
FPT bắt tay hai công ty Mỹ đưa AI “vào guồng” trong lĩnh vực bảo hiểm và đầu tư tư nhân
FPT mở chương trình đào tạo thạc sĩ ứng dụng AI vào phân tích dữ liệu kinh doanh
Startup AI choáng váng trước bộ công cụ nhà phát triển mới của OpenAI: "Một nửa giới startup AI hiện tại sẽ bị hủy diệt"
Để mặc AI bịa đặt thông tin trong báo cáo, một hãng kiểm toán danh tiếng phải cay đắng hoàn tiền cho khách hàng