Nvidia lặng lẽ xóa Rubin CPX khỏi lộ trình, ưu tiên chip Groq 3 LPU

Nvidia lặng lẽ xóa Rubin CPX khỏi lộ trình, ưu tiên chip Groq 3 LPU

-

Lưu lại đọc sau

Sự vắng mặt hoàn toàn của Rubin CPX tại GTC 2026 phát đi tín hiệu rõ ràng rằng Nvidia đang tái định hướng chiến lược AI inference sang công nghệ mới vừa thâu tóm từ startup Groq.


Một trong những điều đáng chú ý nhất tại buổi keynote GTC 2026 của Jensen Huang hôm thứ Hai không phải là thứ được công bố, mà là thứ hoàn toàn không được nhắc đến: chip Rubin CPX — bộ tăng tốc pha ngữ cảnh từng được Nvidia quảng bá năm ngoái là thành phần quan trọng của nền tảng Vera Rubin — biến mất hoàn toàn khỏi các slide trình chiếu, nhường chỗ cho Groq 3 LPU và rack LPX.

Rubin CPX là gì và tại sao nó từng quan trọng?

Rubin CPX được thiết kế để xử lý giai đoạn ngữ cảnh — pha tính toán nặng nhất khi xử lý đầu vào để tạo ra token đầu ra đầu tiên trong các mô hình ngôn ngữ lớn. Điểm mạnh của nó là sử dụng bộ nhớ GDDR7 thay vì HBM3E hay HBM4. Dù băng thông kém hơn, GDDR7 tiêu thụ điện năng ít hơn đáng kể, giúp nền tảng Rubin cạnh tranh hơn trong các tác vụ inference. Theo thông số được công bố trước đó, Rubin CPX có thể đạt tới 30 NVFP4 PetaFLOPS — con số ấn tượng, nhưng đi kèm độ trễ cao hơn đáng kể.

gamen.pro Rubin CPX 180320261

Groq 3 LPU: Ưu tiên mới của Nvidia

Thay thế Rubin CPX trong các slide GTC 2026 là Groq 3 LPU — bộ vi xử lý suy luận độ trễ thấp mà Nvidia gọi là LPU. Khác với các chip GPU truyền thống phụ thuộc vào DRAM, Groq 3 chủ yếu dựa vào bộ nhớ SRAM nội bộ — nhanh hơn, độ trễ thấp hơn và tiêu thụ điện ít hơn so với bất kỳ loại DRAM nào. Chip LP30 trong dòng này trang bị 512 MB SRAM, đạt hiệu năng 1,23 FP8 PFLOPS, hoặc 9,6 PFLOPS mỗi compute tray Groq 3 LPX và lên đến 315 FP8 PFLOPS mỗi rack.

Bước đi này có lý do rõ ràng. Hồi đầu năm, Nvidia đã chi 20 tỷ USD để mua giấy phép không độc quyền công nghệ chip và tiếp nhận nhân tài từ startup Groq. Việc ưu tiên LPU trên lộ trình sản phẩm sau thương vụ đó là diễn biến hoàn toàn hợp lý.

Liệu Rubin CPX có thực sự “chết”?

Dù tín hiệu khá rõ ràng, vẫn còn quá sớm để kết luận Rubin CPX bị khai tử hoàn toàn. Một số khách hàng của Nvidia đã đầu tư điều chỉnh phần mềm để tương thích với CPX, và trong ngành chip, các sản phẩm ngoài lộ trình chính thức vẫn thường xuyên được sản xuất theo yêu cầu đặc biệt. Tuy nhiên, việc không xuất hiện trong slide keynote của CEO và bị thay thế bởi một kiến trúc mới hơn là dấu hiệu khó bỏ qua về thứ tự ưu tiên thực sự của Nvidia trong cuộc đua AI inference.

Đội ngũ admin quản trị luôn nỗ lực hết mình để đem đến những nội dung chất lượng nhất cho các thành viên tham gia. Mọi ý kiến đóng góp xin gửi về [email protected]. Liên hệ hợp tác quảng cáo: https://t.me/satoshikton. Thông cáo báo chí cần đăng: [email protected]

GameN - MXH dành cho game thủ Việt

Ban quản trị

ĐỌC NHIỀU