images
12/09/2022 05:26 pm

Những điểm nhấn trên kiến trúc AMD Zen 4

Nguồn: tinhte

Theo đúng lịch thì còn khoảng 3 tuần nữa, người dùng toàn cầu sẽ bắt đầu sở hữu được nền tảng AMD AM5 mới.

Theo đúng lịch thì còn khoảng 3 tuần nữa, người dùng toàn cầu sẽ bắt đầu sở hữu được nền tảng AMDAM5 mới. Những vi xử lý AMD Ryzen 7000 dựa trên kiến trúc Zen 4 mang lại những điểm nhấn ấn tượng, cho trải nghiệm hoàn toàn mới so với thế hệ Zen 3 cũng như socket AM4 trước đây.

Tiến trình 5 nm


Kiến trúc Zen 4 được AMD đặt hàng TSMC sản xuất toàn bộ, dùng tiến trình công nghệ 5 nm (node N5) tiên tiến hơn 7 nm của Zen 3, nhưng chỉ dành cho chiplet CPU, hay còn gọi là CCD (Core Complex Die) chứa các nhân Zen 4 và bộ đệm L3. Bên cạnh CCD 5 nm, IOD (I/O Die) được sản xuất trên tiến trình 6 nm, cũng là 1 cải tiến so với Zen 3 vốn dùng tiến trình 12 nm khá cũ của GlobalFoundries. Tên mã của dòng vi xử lý Ryzen 7000 là “Raphael”, tuy nhiên tên mã của CCD được nội bộ AMD gọi là “Durango”, trong khi kiến trúc nhân CPU có tên “Persephone”. Tóm lại, vi xử lý Raphael chứa 1 - 2 Durango CCD, mỗi CCD này chứa các nhân Persephone, tùy theo mẫu mã.

amd-zen-4-durango.jpg

CCD Durango có kích thước nhỏ hơn 10% so với Zen 3 CCD trên Ryzen 5000 Series, theo số liệu do AMD cung cấp thì có diện tích 71 mm2, trong khi thế hệ trước là 83.74 mm2. Tuy nhỏ hơn nhưng Durango chứa đến 6.57 tỉ transistor, nhiều hơn đến 58% so với 4.15 tỉ transistor trong CCD của Zen 3. Tiến trình công nghệ nhỏ hơn đã giúp cho mỗi mm2 diện tích đế có thể có đến hơn 90 triệu bóng bán dẫn. AMD cũng cho biết rằng họ chọn node N5 15 lớp để có thể vừa hoạt động được ở mức xung cao hơn, đồng thời tăng mật độ transistor dày đặc hơn. Ở phiên bản cao nhất, mỗi CCD vẫn gồm 8 nhân và mức L3 cache 32 MB không đổi, vì vậy xét theo số lượng transistor, mức tăng thêm là rất cao.

Quảng cáo


amd-zen-4-cpu-z-tinhte-1.jpg

Phía AMD không xem Zen 4 là 1 kiến trúc hoàn toàn mới như Zen 3 trước đây, thay vào đó họ coi Zen 4 như là 1 phiên bản cập nhật tăng cường của Zen 3, mang thêm những cải tiến và nâng cấp. Điều này được xác thực qua phần mềm kiểm tra CPU-Z, với Ryzen 7000 Series có phần Ext. Family vẫn là 19 như Ryzen 5000 Series. Thay đổi lớn nhất mà Zen 4 mang lại nằm ở phần Front End của vi xử lý, được thiết kế để tận dụng tối đa tài nguyên phần cứng, giảm thiểu thời gian trống của chúng. Dự kiến, Zen 5 mới là 1 kiến trúc mới hoàn toàn, Ext. Family được cho là sẽ thay đổi thành 1A.

Bộ đệm lớn


https://twitter.com/SkyJuice60/status/1564405596303962113

amd-zen-4-cache-tinhte.jpg

Trong khi dung lượng bộ đệm L3 vẫn giữ nguyên mức 4 MB mỗi nhân trên Zen 4 thì bộ đệm L2 được nâng lên gấp đôi, từ 512 KB lên 1 MB mỗi nhân. Việc tăng L2 cache cũng đồng thời tăng độ trễ thêm 2 cycle (nhịp), từ 12 cycle lên 14 cycle. Ngoài ra, dù dung lượng L3 cache giữ nguyên 4 MB mỗi nhân, tổng 32 MB mỗi CCD nhưng độ trễ của bộ đệm L3 vẫn tăng thêm 4 cycle, từ 46 lên 50 cycle, điều này có thể do AMD đã tăng mức xung hoạt động, dẫn đến độ trễ cao hơn nhưng mỗi cycle lại ngắn hơn. Nếu đúng như vậy, hiệu năng và độ trễ thực tế có thể vẫn giữ nguyên như Zen 3.

https://twitter.com/chiakokhua/status/1564413952108335105


Bộ đệm uOP (micro-Operation cache) cải thiện, cao hơn 1.5 lần so với Zen 3. Trước đây, Zen 2 có uOP cache là 4000 entries và giữ nguyên ở thế hệ Zen 3, nhưng Zen 4 đã bổ sung thêm 2000 entries, nâng lên 6000 entries uOP cache. Bộ đệm đặc biệt này chứa các chỉ lệnh đã được giải mã (decoded instruction) giúp vi xử lý có thể sử dụng lại chúng mà không cần phải thông qua các bộ giải mã lệnh (instruction decoder) vốn mất thời gian và tiêu tốn năng lượng.

amd-zen-4-vs-zen-3-tinhte.png

Quảng cáo


ReOrder Buffer (ROB) trên Zen 4 cũng được nâng cao hơn. Là trái tim của kiến trúc không theo thứ tự (out-of-order architecture), ROB là nơi mà vi xử lý thay đổi thứ tự thực thi chỉ lệnh, nếu khu vực “xếp hàng” này càng dài, số lệnh vào hàng chờ sẽ càng lớn, từ đó vi xử lý có thể nhìn thấy nhiều chỉ lệnh và sắp xếp thứ tự, tối ưu hóa việc gửi lệnh đến đúng nơi tốt hơn, tối thiểu hóa số cycle cần để xử lý. Kiến trúc Zen 3 có ROB chứa 256 entries, chỉ ngang với ROB của Gracemont - kiến trúc nhân Efficient trên Intel Alder Lake, trong khi nhân Performance - Golden Cove - sở hữu ROB đến 512 entries. Zen 4 được cho là tăng cường thêm 25% ở ROB, đạt mức 320 entries, dù vậy nó vẫn thấp hơn 32 entries so với Intel Sunny Cove (thế hệ 11 Ice Lake).

Cải thiện IPC hơn 13%, xung cao, hiệu năng tốt


Theo AMD, IPC trên Zen 4 sẽ cao hơn 13% so với Zen 3. Đây là con số trung bình mà AMD tính toán dựa trên 22 lần thử nghiệm ở các phần mềm khác nhau, cố định xung 4 GHz trên vi xử lý 8 nhân 16 luồng. Mức cải thiện IPC trải dài từ thấp nhất 1% (CPU-Z 1 thread) đến cao nhất 39% (wPrime 1024M). Lưu ý rằng IPC của vi xử lý không cố định mà thay đổi tùy thuộc vào mã nguồn tự nhiên của phần mềm. Các ứng dụng quen thuộc như Lightroom tăng 5%, Premier tăng 11%, V-Ray CPU tăng 15% nhưng cá biệt wPrime lại tăng đến 39%, khả năng là do sự có mặt của AVX-512.

amd-zen-4-ipc-tinhte.jpg

Nhiều tựa game cũng có mức IPC tăng thêm khá tốt, nhưng lưu ý rằng game sẽ dựa trên bộ nhớ trong nhiều hơn là nhân xử lý. Fortnite chỉ tăng 3% IPC trong khi CS:GO tăng 13% và Dolphin Bench (giả lập Nintendo Wii và Gamecube) tăng đến 32%. Hệ thống mà AMD dùng để xác định cải thiện IPC là Ryzen 7 5800X và Ryzen 7 7700X, cùng chạy ở 4 GHz, với RAM tương ứng DDR403600 CL16 và DDR5-6000 CL30, đồ họa rời AMD Radeon RX 6950 XT trên nền hệ điều hành Windows 11.

amd-zen-4-ipc-tinhte-1.jpg

Kiến trúc Zen 4 tận dụng tiến trình 5 nm tiên tiến nên có thể đẩy vi xử lý hoạt động ở ngưỡng xung cao hơn khá nhiều. Mức boost đơn nhân có thể đạt đến 5.7 GHz, cao hơn 800 MHz so với Ryzen 5000 Series “Zen 3” trên tiến trình 7 nm. AMD cũng cho rằng trong trường hợp tốt nhất, hiệu năng đơn nhân của Ryzen 7000 Series có thể cao hơn đến 29%, nghĩa là gần 1/3. Con số này có được từ việc so sánh benchmark đơn nhân trên Geekbench 5.4 giữa Ryzen 9 5950X + DDR4-3600 CL16 và Ryzen 9 7950X + DDR5-6000 CL30.

Quảng cáo



amd-zen-4-ipc-tinhte-2.jpg

Geekbench 5.4 chấm điểm đơn nhân cho Ryzen 7000 Series đều cao hơn Core i9-12900K và cả mẫu i9-12900KS. Theo đó, Ryzen 9 7950X đạt 2275 điểm, theo sau là Ryzen 9 7900X đạt 2250 điểm, Ryzen 7 7700X đạt 2225 điểm và cuối cùng là Ryzen 5 7600X đạt 2175 điểm. Dĩ nhiên, kết quả này được thử nghiệm với RAM nhanh hơn (DDR5-6000 CL30). Hiệu năng đa nhân theo AMD thì cải thiện từ 32% đến 48% ở ứng dụng sáng tạo (Corona Render, Arnold Render, POV-Ray và V-Ray Render), trong khi đó sẽ tăng thêm 6% đến 35% tùy game (Borderlands 3, CS:GO, DOTA 2 và Shadow of the Tomb Raider).

Socket AM5 đóng gói LGA


Các thế hệ Zen trước đây sử dụng kiểu đóng gói PGA (Pin Grid Array), dù rằng socket rất khó hư hỏng nhưng ngược lại người dùng hay gặp tình trạng cong/gãy chân CPU. Ngoài ra, trường hợp tháo gỡ tản nhiệt không đúng cách cũng nhiều lần khiến CPU “bay” theo tản nhiệt khi socket vẫn đang khóa. Ở Zen 4, các vi xử lý Ryzen 7000 Series chuyển sang dạng đóng gói LGA (Land Grid Array) - tương tự như cách mà phía Intel sử dụng từ rất lâu - với 1718 chân. AMD cũng thiết kế độ cao IHS và kích cỡ phần lưng thích hợp để tương thích ngược với những mẫu tản nhiệt dùng cho socket AM4 trước đó.

amd-zen-4-cpu-tinhte.jpg

Khác với Intel, AMD chọn cách mang tất cả những linh kiện SMD (Surface Mount Device) lên mặt trên đế chip, cùng phía với CCD và IOD. Điều này dẫn đến toàn bộ mặt dưới đế chip Zen 4 là khoảng trống dành cho việc bố trí chân tiếp xúc. Tuy có số lượng chân nhiều hơn thế hệ 12 của Intel nhưng mật độ chân của Zen 4 không dày đặc bằng. Ngoài ra, vì mang linh kiện SMD lên trên, AMD bắt buộc phải thiết kế IHS (Integrated Heat Spreader) có hình dạng bạch tuộc với 8 chân, vừa nhường khoảng trống cho SMD, vừa có khe hở để phần nào thoát nhiệt cho những linh kiện siêu nhỏ này.

IHS của AMD Ryzen 7000 đã được “delid”, rất dày, CCD lệch cạnh

Có vẻ như Ryzen 7000 bản thử nghiệm của AMD đã “xui xẻo” rơi vào tay 1 OCer “phá phách”, nhanh chóng bị delid - cạy nắp lưng. Những hình ảnh đầu tiên cho chúng ta cái nhìn về cách sắp xếp CCD (Core Chiplet Die) và IOD (Input/Output Die) trên Zen 4…
tinhte.vn


Để cho người dùng yên tâm hơn, AMD đã tiến hành hàn CCD và IOD vào IHS, giúp dẫn nhiệt nhanh hơn lên bề mặt. Điểm thú vị trong thiết kế này nằm ở chỗ AMD mạ vàng cả mặt dưới IHS và mặt trên CCD, với 2 mục đích: truyền dẫn nhiệt tốt hơn và quá trình hàn dễ dàng hơn. Chất liệu làm TIM (Thermal Interace Material) cao cấp được sử dụng là Indium dạng lá, có hệ số dẫn nhiệt đến 81.8 W/mK, và việc hàn vàng với Indium sẽ đơn giản hơn mà không cần chất trợ hàn (solder flux). Nếu không mạ vàng, AMD vẫn có thể hàn silicon vào đồng, nhưng khó hơn và cần có sự trợ giúp của chất trợ hàn để phá vỡ các lớp oxi hóa.

DDR5PCIe 5.0


Sau nhiều năm duy trì socket AM4 cùng với RAM DDR4, thế hệ Zen 4 AM5 đã có bước tiến bộ lớn, chuyển hoàn toàn sang những công nghệ và tính năng hiện đại nhất. Vi xử lý Ryzen 7000 Series và nền tảng AM5 chỉ hỗ trợ RAM DDR5 cũng như cung cấp các làn PCIe 5.0. Mức giá hiện tại của DDR5 vẫn còn cao, dù tốc độ được cải thiện nhưng độ trễ lớn, dù vậy khả năng nâng cấp, cải tiến về sau là rất lớn. DDR4 đã đi đến cuối chặng đường, trong khi DDR5 là tương lai, chúng ta hoàn toàn có thể kỳ vọng thấy được những kit DDR5 không chỉ có dung lượng lớn hơn, tốc độ cao hơn mà độ trễ cũng sẽ giảm dần. Ngoài ra, DDR5 cũng tiết kiệm năng lượng hơn.

AMD chính thức ra mắt Ryzen 7000: Zen4 5nm, DDR5, PCIe 5.0, socket AM5, tăng hiệu năng chơi game

Cuối cùng thì AMD cũng chính thức cho ra mắt Zen4 cùng loạt vi xử lý thế hệ mới nhất Ryzen 7000 Series. Đây là những con CPU mới nhất mà nhiều ngày qua chúng ta đã nghe nhắc tới với mã hiệu Raphael, được phát triển dựa trên tiến trình 5nm…
tinhte.vn


Chuẩn PCIe 5.0 mang đến băng thông cao hơn, thích hợp cho những mẫu SSD thế hệ mới, có tốc độ đọc ghi lên đến 10 GBps, thậm chí đến 12 GBps. Để so sánh thì SSD PCIe 4.0 hiện tại đang nằm ở giới hạn khoảng 7 GBps, nghĩa là mức tăng về tốc độ truyền tải từ 43% đến 71%. Chưa dừng lại ở đó, những mẫu card đồ họa thế hệ mới sắp xuất hiện như NVIDIA GeForce RTX 4000 Series cũng sẽ tương thích với chuẩn PCIe 5.0, mang lại hiệu năng cao hơn cho những hệ thống PC cao cấp.

Bài viết liên quan