Dựa vào thông số kỹ thuật vừa được rò rỉ, rất có thể card đồ họa ARC phiên bản cao cấp nhất của Intel ra mắt vào đầu năm 2022 tới sẽ có sức mạnh cạnh tranh được với cả hai sản phẩm tầm trung/cận cao cấp của AMD và Nvidia là RX 6700 XT và RTX 3070. Trước đó, Intel đã xác nhận card đồ họa ARC trang bị GPU Xe-HPG Alchemist sẽ được chính thức bán ra thị trường vào khoảng quý I năm sau, và chip GPU sẽ được sản xuất trên tiến trình 6nm của TSMC.
Bên trong mỗi GPU Xe-HPG Alchemist sẽ được trang bị nhân Xe-Core, nền tảng của sản phẩm ARC thế hệ đầu tiên. Đây là một compute block bao gồm 16 Vector Engine (256-bit mỗi engine) và 16 Matrix Engines (1024-bit mỗi engine). Mỗi Vector Engine bao gồm 8 ALU, tổng cộng GPU trang bị 128 ALU. Mỗi block Matrix Engine sẽ đảm nhiệm các tác vụ tensor ở cả hai chế độ ,FP16 và INT8. Mỗi nhân Xe-Core này sẽ có bộ nhớ đệm L1 riêng:
Khởi đầu với nền tảng Xe-Core này, Intel tạo ra một “Render Slice” bao gồm 4 nhân Xe-Core, kết hợp với 4 cụm xử lý Ray Tracing, 4 Sampler Units, ba engine xử lý Geometry/Rasterize/HiZ phục vụ xử lý hình ảnh đồ họa, và cuối cùng là hai cụm Pixel Backend, mỗi cụm 8 unit xử lý điểm ảnh. Mỗi Render Slices này sẽ được kết hợp với nhau trên một die chip xử lý đồ họa kiến trúc Alchemist:
Thiết kế kiến trúc Xe-HPG
Bên trong mỗi GPU Xe-HPG Alchemist sẽ được trang bị nhân Xe-Core, nền tảng của sản phẩm ARC thế hệ đầu tiên. Đây là một compute block bao gồm 16 Vector Engine (256-bit mỗi engine) và 16 Matrix Engines (1024-bit mỗi engine). Mỗi Vector Engine bao gồm 8 ALU, tổng cộng GPU trang bị 128 ALU. Mỗi block Matrix Engine sẽ đảm nhiệm các tác vụ tensor ở cả hai chế độ ,FP16 và INT8. Mỗi nhân Xe-Core này sẽ có bộ nhớ đệm L1 riêng:
Khởi đầu với nền tảng Xe-Core này, Intel tạo ra một “Render Slice” bao gồm 4 nhân Xe-Core, kết hợp với 4 cụm xử lý Ray Tracing, 4 Sampler Units, ba engine xử lý Geometry/Rasterize/HiZ phục vụ xử lý hình ảnh đồ họa, và cuối cùng là hai cụm Pixel Backend, mỗi cụm 8 unit xử lý điểm ảnh. Mỗi Render Slices này sẽ được kết hợp với nhau trên một die chip xử lý đồ họa kiến trúc Alchemist:
Phiên bản cao cấp nhất sẽ gộp 32 Render Slice này lại với nhau, tạo ra 32 nhân Xe-Core, 512 Vector Engine, và tổng cộng 4096 ALU. Cũng sẽ có những sản phẩm tầm dưới, nhân GPU chỉ trang bị 2, 4 hoặc 6 Render Slice, và sẽ được ra mắt trong năm 2022:
So sánh cấu hình Intel ARC Alchemist/Nvidia RTX 3070/AMD Radeon RX 6700 XT
Dưới đây là tổng hợp cấu hình của ba GPU do 3DCenter liệt kê. Có thể nhận ra, GPU Alchemist của Intel có nhiều Texture Mapping Unit cũng như Render Output Unit hơn cả GA104 và Navi 22. Lượng nhân xử lý cũng cao hơn Navi 22 và Navi 21 của AMD, nhưng vẫn thấp hơn con số tối đa 6.144 nhân CUDA của GA 104. Cũng phải ghi nhớ rằng Nvidia áp dụng phương pháp đếm FP32 đôi, nên cũng có thể nói trên GPU GA 104 của Nvidia chỉ có 3072 nhân xử lý.
So với hai sản phẩm của AMD và Nvidia, GPU cao cấp nhất của Intel có ít nhân xử lý ray tracing hơn. Nhưng xét đến trường hợp của Navi 22, dù nhiều nhân Ray Tracing hơn, nhưng hiệu năng vẫn không thể ngang ngửa được với GA 104, vì GPU của Nvidia tích hợp và tối ưu phần cứng tốt hơn rất nhiều. Vì thế dù ít nhân RT hơn, card đồ họa Intel vẫn có khả năng tạo ra khác biệt nếu các kỹ sư của hãng biết cách tối ưu tích hợp phần cứng để hiệu năng xử lý ray tracing tốt nhất có thể trong các tựa game hỗ trợ.
Một lợi thế lớn khác Intel đang cố tạo ra là công nghệ nâng cấp hình ảnh bằng AI. Nvidia có DLSS, thì Intel có XeSS, vừa được trình diễn cách đây ít lâu, và nếu thông số nhân tensor trên GPU Alchemist của Intel đủ ấn tượng như số liệu (512 nhân), khả năng nâng cấp đồ họa, giảm tải GPU trong quá trình xử lý hình ảnh sẽ vô cùng hứa hẹn. GA 104 chỉ có 192 nhân Tensor thế hệ thứ 3, còn Xe-HPG Alchemist có tới 512 nhân XMX. Và nếu tin tức là chính xác, thì Intel sẵn sàng trang bị tới 16GB GDDR6 để tải những game 4K, cao gấp đôi con số mà RTX 3070 và 3070 Ti đang có hiện tại.
Quảng cáo
Cuối cùng là sức mạnh xử lý FP32 trong biểu đồ kể trên là con số kỳ vọng khi GPU của Intel chạy ở xung nhịp 2.0 GHz. Con số này hoàn toàn có thể đạt được, vì GPU của Intel được sản xuất trên tiến trình 6nm TSMC, mà chúng ta đều đã biết khả năng nâng xung nhịp của những con chip 7nm TSMC ấn tượng đến đâu rồi. Dựa vào những con số ấy, Intel ARC Alchemist hoàn toàn có thể đạt ngưỡng 16 đến 17 TFlops sức mạnh xử lý FP32. Con số này thấp hơn của GA104, nhưng FLOP của mỗi kiến trúc đều khác nhau, không thể so sánh trực tiếp vào bối cảnh từng trò chơi và tốc độ khung hình của chúng được.
Tóm lại, nếu Intel tạo ra được một sản phẩm như hứa hẹn, chúng ta sẽ rất sớm có một giải pháp cạnh tranh với cả RX 6700 XT lẫn RTX 3070. Và để giành lấy thị phần PC gaming sớm, Intel cũng rất có thể sẽ chơi chiến lược giá vô cùng cạnh tranh và hấp dẫn đối với người tiêu dùng. Chẳng có lẽ, Intel is back?
Theo WCCFTech