اینتل مدعی است GPU Ponte Vecchio HPC تا 2.5 برابر سریعتر از NVIDIA A100 است.

Ponte Vecchio Memory & Throughput، منبع: Intel HotChips34

منبع: Wccftech





منبع

اینتل در HotChip34 جزئیات بیشتری را در مورد پردازنده گرافیکی Ponte Vecchio Xe-HPC خود افشا می کند.

Ponte Vecchio در DPC++ با SYCL & CUDA، منبع: Intel HotChips34

Ponte Vecchio دارای فرآیندهای Intel 7، TSMC N7 و N5 است. این دستگاه با استفاده از فناوری بسته بندی 2.5 بعدی Foveros و EMIB (پل اتصال چندگانه) ساخته شده است. یک Ponte Vecchio به ترتیب دارای 128 هسته Xe، 128 واحد ردیابی پرتو و 64 مگابایت و 408 مگابایت حافظه نهان L1 و L2 است. این پردازنده گرافیکی همچنین به 128 گیگابایت حافظه HBM2e مجهز شده و از آخرین رابط صنعتی PCIe Gen5 پشتیبانی می کند.

اولین پردازنده گرافیکی عمومی مرکز داده این شرکت با استفاده از 47 چیپلت با ترکیب چندین معماری و گره ساخته شده است. این بسیار پیچیده ترین پردازنده گرافیکی است که اینتل تا به حال ساخته است، اما معماری آن بارها به عقب رانده شده است.

Ponte Vecchio در ExaSMR & miniBUDE، منبع: Intel HotChips34

پردازنده گرافیکی دو پشته‌ای Ponte Vecchio سریع‌تر از NVIDIA A100 طبق گفته اینتل

جزئیات فاش شده در HotChips34 توسط Hong Jiang، همکار و معمار محاسبات پردازنده گرافیکی اینتل، شامل حداکثر توان عملیاتی نظری مبتنی بر توان محاسباتی تک دقیق و دوگانه برای Ponte Vecchio دو پشته است. همچنین ارقامی برای بارهای کاری محاسبه شده توسط هسته های XMX که بخشی از معماری Xe-HPC هستند، تسریع شده است.

این اولین بار نیست که اینتل آمار عملکرد Ponte Vecchio را به اشتراک می گذارد. با این حال، راه اندازی این پردازنده گرافیکی HPC جدید مدت هاست که به تعویق افتاده است. Ponte Vecchio قرار بود با ابررایانه Aurora در کنار CPUهای Sapphire Rapids Xeon، اولین ابررایانه مقیاس بزرگ ایالات متحده، اولین کار را آغاز کند. با این حال، این عنوان در حال حاضر متعلق به Frontier مجهز به پردازنده‌های AMD نسل سوم EPYC و پردازنده‌های گرافیکی AMD Instinct MI250X (بهترین عملکرد 1.6 Exaflop) است.