linh_449
Linh Linhh
Những thông tin đến từ các kênh TechTubers, RedGamingTech và Moore's Law is Dead vừa đồng loạt công bố những thông tin chưa chính thức đầu tiên về thế hệ card đồ họa chơi game mới của Nvidia, RTX 50 series. Nếu Nvidia giữ lịch trình ra mắt sản phẩm giống hệt như mọi thế hệ GPU tiêu dùng trước, thì phải tới tháng 9/2024, RTX 50 series mới chính thức ra mắt thị trường. Nhưng những thông số kỹ thuật được đồn đoán của thế hệ GPU này, như đã nói, đã được tung ra.
Đầu tiên hãy nói về tên mã của sản phẩm trước. Những thông tin trước đó cũng đã đề cập tới thế hệ GPU tên mã Blackwell. Tên mã này lấy theo tên nhà toán học và thống kê học người Mỹ, David Blackwell (1919 - 2010), người đã có những đóng góp đáng kể cho việc phát triển lý thuyết trò chơi, lý thuyết xác suất, thống kê và lý thuyết thông tin.
Ban đầu đáng lẽ Blackwell sẽ là thế hệ GPU phục vụ nghiên cứu AI và xử lý hệ thống siêu máy tính kế cận của Hopper hiện tại, nhưng bên cạnh GPU GB100 cao cấp nhất, sẽ có GB102, dự kiến trang bị trong RTX 5090.
Vẫn giữ thiết kế die đơn monolithic
Như vậy là chiplet đã được đem tới GPU chơi game kiến trúc tập lênh x86, sau khi AMD ra mắt thế hệ card đồ họa RDNA 3 với hai sản phẩm đã có mặt trên thị trường, RX 7900 XT và XTX. Thiết kế chiplet của GPU AMD hơi khác so với kết cấu CCX (Core Complex) nằm trong những cụm CCD (Core Chiplet Die) trên chip CPU Ryzen.
Sản xuất trên tiến trình TSMC 3nm
Tin đồn thứ hai là tiến trình mà GPU thế hệ Blackwell sẽ dựa vào để sản xuất thương mại hóa. Thông tin hiện giờ đều nói Nvidia sẽ ứng dụng tiến trình 3nm TSMC. Đến thời điểm hiện tại, mọi thế hệ GPU mới của Nvidia đều ứng dụng tiến trình thu nhỏ khoảng cách transistor trên die silicon của chip: GTX 10 (Pascal) sản xuất trên tiến trình 16nm TSMC, RTX 20 (Turing) là 12nm TSMC, RTX 30 (Ampere) thì dùng Samsung 8nm, còn RTX 40 (Ada Lovelace) hiện tại thì dùng tiến trình 4nm TSMC, vốn là bản nâng cấp của tiến trình N5.
Quý IV năm 2022, TSMC đã bắt đầu sản xuất thử nghiệm số lượng lớn chip 3nm, trước khi mở đặt hàng cho làm chip quy mô thương mại cho các đối tác lớn của họ. Tuy nhiên, những tiến bộ về hiệu năng xử lý và hiệu năng tiêu thụ điện của N3 TSMC lại tăng cùng với chi phí sản xuất một tấm wafer silicon gia công die chip trên tiến trình này.
Apple đã "giành" hết toàn bộ nguồn cung chip 3nm đợt đầu từ TSMC
Theo nhiều nguồn tin, giá bán một tấm wafer đã gia công thành phẩm chip xử lý dựa trên tiến trình N3 sẽ cao hơn 25% so với tiến trình N5. Điều này hoàn toàn có thể đồng nghĩa với việc RTX 50 series thậm chí sẽ còn đắt hơn cả RTX 40 series, một thế hệ card đồ họa bị coi là giá quá cao của Nvidia.
Những thông số kỹ thuật đầu tiên của RTX 50 series “Blackwell”
Đây là những thông tin mà clip trên YouTube của kênh RedGamingTech chia sẻ. Quan trọng và đáng kể đến nhất, theo nguồn tin này, kiến trúc nhân CUDA sẽ được nâng cấp mạnh, dù rằng đây không phải thiết kế mới hoàn toàn. Cụ thể hơn, những cụm Stream Microprocessor trong GPU Blackwell sẽ có bố cục mới, và sẽ có những tối ưu và cải tiến đáng kể đối với cụm chip denoising khử nhiễu cho hình ảnh sau khi xử lý Ray Tracing/Path Tracing.
Gần đây Nvidia liên tục có những động thái phổ cập hóa công nghệ Path Tracing, bắt đầu với Portal RTX, bản cập nhật đồ họa miễn phí cho trò chơi đã ra mắt từ lâu, và hai ngày nữa là Cyberpunk 2077 với cập nhật Path Tracing trong chế độ đồ họa RT Overdrive. Cũng sẽ là dễ hiểu khi RTX 50 sẽ được trang bị nhân RT khỏe hơn để xử lý Path Tracing hiệu quả và tối đa được tốc độ khung hình hơn.
Về mặt phần cứng, thế hệ GPU Blackwell được cho là sẽ hỗ trợ công nghệ bộ nhớ GDDR7 đang được các hãng chip nhớ nghiên cứu. GDDR6X vẫn còn "trần" để cải thiện băng thông và hiệu năng, nhưng nếu GDDR7 thực sự tạo ra hiệu năng tiêu thụ điện tốt hơn, thì đó chắc chắn sẽ là lựa chọn tốt. Hiện tại thì Samsung đang bận phát triển công nghệ chip nhớ GDDR6W mới, tạo ra băng thông cao hơn và dung lượng mỗi con chip cũng cao hơn.
Nhưng hiện tại Nvidia chỉ mua RAM HBM của Samsung để trang bị cho những GPU phục vụ hệ thống trung tâm dữ liệu, siêu máy tính cũng như những hệ thống nghiên cứu AI, chứ sản phẩm tiêu dùng thì họ lại không mua VRAM của Samsung.
Ở một khía cạnh khác, Cadence hiện giờ đã có giải pháp GDDR7 thử nghiệm, đã gửi cho các đối tác để xác lập tiêu chuẩn bộ nhớ VRAM mới. Còn Samsung thậm chí còn hứa hẹn rằng băng thông của GDDR7 có thể đạt mức 36 Gbps với chuẩn tín hiệu PAM3, và Micron cũng được cho là sẽ sớm ra mắt chip GDDR7 mà họ phát triển.
Và với GDDR6X và GDDR6W, thì có lẽ Nvidia sẽ ứng dụng công nghệ ấy cho… RTX 4080 Ti và RTX 4090 Ti, rất có thể sẽ ra mắt năm nay?
Kopite7kimi thì nói rằng, với kiến trúc Blackwell, có thể Nvidia sẽ cho ra mắt một mẫu card đồ họa sở hữu bus interface lên tới 512-bit, tạo ra tốc độ truyền dữ liệu 2.304 GB/s ở băng thông VRAM 36 Gbps của GDDR7. Nhưng rất rất lâu rồi Nvidia chưa làm card đồ họa với bus-interface 512GB. Lần cuối họ cho ra mắt một sản phẩm như vậy là năm 2009, với mẫu GTX 285. Còn đến cả RTX 4090 hiện giờ cũng chỉ có bus interface 384-bit, kết hợp với GDDR6X, tạo ra tốc độ 1.008 GB/s.
Nếu như RTX 40 series hiện giờ hỗ trợ chuẩn kết nối PCIe 4.0x16, thì RTX 50, theo tin đồn, sẽ ứng dụng chuẩn PCIe 5.0x16 mà những thế hệ bo mạch chủ mới hiện giờ đã hỗ trợ.
Với GPU tiêu dùng cao cấp nhất, GB102 dự kiến trang bị trên RTX 5090, nhân xử lý đồ họa sẽ chạy ở xung nhịp trên 3GHz, sở hữu 144 SM, 96MB bộ nhớ đệm L2. Con số nhân xử lý và bộ nhớ đệm giống hệt như AD102 trên RTX 4090 hiện giờ, nhưng với những cải tiến đối với kiến trúc nhân CUDA và xung nhịp cao hơn rất nhiều so với Ada Lovelace, Blackwell dự kiến tạo ra hiệu năng gấp đôi so với kiến trúc hiện tại.
Ngay ở thời điểm này, RTX 4090 với GPU AD102 không chỉ tạo ra hiệu năng xử lý rasterization những cảnh game cao hơn hẳn so với thế hệ GPU trước đó, mà còn có những cải tiến lớn trong khả năng xử lý Ray Tracing cũng như DLSS thông qua nhân Tensor. Nếu những tin đồn trên đây là sự thật, thì thứ nhất, RTX 5090 sẽ là một con quái vật còn khủng hơn cả RTX 4090 hiện giờ, và thứ hai, chắc chắn nó sẽ không rẻ.