Ponte Vecchio دارای فرآیندهای Intel 7، TSMC N7 و N5 است. این دستگاه با استفاده از فناوری بسته بندی 2.5 بعدی Foveros و EMIB (پل اتصال چندگانه) ساخته شده است. یک Ponte Vecchio به ترتیب دارای 128 هسته Xe، 128 واحد ردیابی پرتو و 64 مگابایت و 408 مگابایت حافظه نهان L1 و L2 است. این پردازنده گرافیکی همچنین به 128 گیگابایت حافظه HBM2e مجهز شده و از آخرین رابط صنعتی PCIe Gen5 پشتیبانی می کند.
جزئیات فاش شده در HotChips34 توسط Hong Jiang، همکار و معمار محاسبات پردازنده گرافیکی اینتل، شامل حداکثر توان عملیاتی نظری مبتنی بر توان محاسباتی تک دقیق و دوگانه برای Ponte Vecchio دو پشته است. همچنین ارقامی برای بارهای کاری محاسبه شده توسط هسته های XMX که بخشی از معماری Xe-HPC هستند، تسریع شده است.
پردازنده گرافیکی دو پشتهای Ponte Vecchio سریعتر از NVIDIA A100 طبق گفته اینتل
اولین پردازنده گرافیکی عمومی مرکز داده این شرکت با استفاده از 47 چیپلت با ترکیب چندین معماری و گره ساخته شده است. این بسیار پیچیده ترین پردازنده گرافیکی است که اینتل تا به حال ساخته است، اما معماری آن بارها به عقب رانده شده است.
این اولین بار نیست که اینتل آمار عملکرد Ponte Vecchio را به اشتراک می گذارد. با این حال، راه اندازی این پردازنده گرافیکی HPC جدید مدت هاست که به تعویق افتاده است. Ponte Vecchio قرار بود با ابررایانه Aurora در کنار CPUهای Sapphire Rapids Xeon، اولین ابررایانه مقیاس بزرگ ایالات متحده، اولین کار را آغاز کند. با این حال، این عنوان در حال حاضر متعلق به Frontier مجهز به پردازندههای AMD نسل سوم EPYC و پردازندههای گرافیکی AMD Instinct MI250X (بهترین عملکرد 1.6 Exaflop) است.
پردازنده های گرافیکی HPC 2022-2023 | ||||
---|---|---|---|---|
VideoCardz.com | NVIDIA H100 SXM | AMD Instinct MI250X OAM | Intel Ponte Vecchio OAM | Intel Rialto Bridge OAM |
تصویر | ||||
پردازنده گرافیکی | GH100 | الدباران (MCM) | پونته وکیو (MCM) | پل ریالتو (MCM) |
ترانزیستورها | 80B | 58.2B | 100B | TBC |
اندازه قالب | 814 میلی متر مربع | 2 x ~ 790 میلی متر مربع | 2×640 میلی متر مربع | TBC |
معماری | هاپر | CDNA2 | Xe-HPC | Xe-HPC |
گره ساخت | TSMC N4 | TSMC N6 | اینتل 7، TSMC N5/N7 | اینتل 4 (؟) |
خوشه های GPU | 132 (پیامک) | 220 (CU) | 128 هسته Xe | 160 هسته Xe |
L2 Cache | 50 مگابایت | 32 مگابایت | 408 مگابایت | TBC |
هسته های تانسور/ماتریس | 528 | 2×440 | 128 | 160 |
اتوبوس حافظه | 5120 بیت | 8192 بیتی | 8192 بیتی | 8192 بیتی (؟) |
اندازه حافظه | 80 گیگابایت HBM3 | 128 گیگابایت HBM2e | 128 گیگابایت HBM2e | HBM3 |
TDP | 700 وات | 560 وات | ~ 600 وات | ~ 800 وات |
رابط/فاکتور فرم | SXM5/PCIe Gen5 | OAM/PCIe Gen5 | OAM/PCIe Gen5 | OAM V2 |
سال راه اندازی | 2022 | 2021 | 2022 | 2023 |
منبع: Wccftech
با Data Parallel C++ (DPC++) اینتل ادعا میکند که GPU Ponte Vecchio آن در برخی از بارهای کاری ۱.۴ برابر تا ۲.۵ برابر سریعتر است. این شرکت همچنین در حال افشای ارقام محاسباتی برای ExaSMR OpenMC (کد انتقال ذرات مونت کارلو) است که در آن GPU اینتل دو برابر کارایی دارد و برای NekRS (حلکننده ناویر استوکس) 1.3 تا 1.7 برابر سریعتر است.
اینتل در HotChip34 جزئیات بیشتری را در مورد پردازنده گرافیکی Ponte Vecchio Xe-HPC خود افشا می کند.