AMD پشتیبانی از WMMA (Wave Matrix Multiply-Acumulate) را به معماری GFX11 (RDNA3)، Tensor Core AMD اضافه می کند؟

rocWMMA یک API C++ را برای تسهیل شکستن مشکلات انباشته شده در ماتریس به قطعات و استفاده از آنها در عملیات بلوکی که به صورت موازی در جبهه‌های موج GPU توزیع می‌شوند، فراهم می‌کند. API یک کتابخانه هدر از کد دستگاه GPU است، به این معنی که شتاب هسته ماتریس ممکن است مستقیماً در کد دستگاه هسته شما کامپایل شود. این می تواند از بهینه سازی کامپایلر در تولید مونتاژ هسته بهره مند شود و هزینه های سربار اضافی پیوند به کتابخانه های زمان اجرا خارجی یا نیاز به راه اندازی هسته های جداگانه را متحمل نمی شود.

منبع: LLVM از طریق @Kepler_L2، رویای کولاکانت







منبع

مهندسان نرم افزار AMD شروع به استقرار وصله های جدید برای معماری آینده GFX11 کردند که با نام RDNA3 نیز شناخته می شود. پچ اخیر نشان می دهد که AMD در حال آماده سازی دستورالعمل های خود است که می تواند روی ماتریس ها کار کند.

در این مورد، Wave Matrix Multiply-Acumulate به معماری GFX11 اضافه شد. این نام رمز پردازنده‌های گرافیکی بازی مصرفی RDNA3 آینده است. این دستورالعمل، همانطور که از نام آن پیداست، بر روی ماتریس ها عمل می کند – آرایه های مستطیلی از جداول حاوی اعداد. این نوع داده به شدت توسط الگوریتم های AI/ML برای ضرب مجموعه های بزرگ اعداد استفاده می شود.

AMD WMMA را می‌توان پاسخی به Tensor Core دانست که از زمان معماری Volta در پردازنده‌های گرافیکی NVIDIA وجود داشته است. NVIDIA این دستورالعمل پیشرفته را برای تقویت فناوری وضوح فوق العاده مبتنی بر NVIDIA DLSS AI تجاری کرده است. اینتل همچنین دستورالعمل‌های XMX/DPAS خود را دارد که بر روی ماتریس‌هایی کار می‌کنند که می‌توانند فناوری XeSS هنوز منتشر نشده را تقویت کنند.

این شرکت می تواند راه خود را برای پشتیبانی از الگوریتم های هوش مصنوعی پیشرفته، مانند فناوری های مدرن با وضوح فوق العاده با معماری RDNA3 آینده خود هموار کند. AMDGPU یک backend برای GPU های AMD برای کتابخانه کامپایلر LLVM است که توسط خود کارمندان AMD به روز شده است. برخی از کاربران این وصله‌ها را به دقت دنبال می‌کنند، که اغلب نشان می‌دهد که نسل جدید پردازنده‌های گرافیکی چه چیزی را می‌تواند به جدول بیاورد.

rocWMMA به عنوان یک کتابخانه هدر منتشر شده است و شامل پروژه های آزمایشی و نمونه برای تأیید و نشان دادن نمونه استفاده از C++ API است. ضرب ماتریس GEMM به عنوان اعتبار سنجی اولیه با توجه به سابقه سنگین برای کتابخانه استفاده می شود. با این حال، نمونه کارها به طور قابل توجهی در حال رشد است و روش های مختلفی را نشان می دهد که rocWMMA ممکن است مصرف شود.

// ذاتی WMMA (Wave Matrix Multiply-Acumulate).
//
// این عملیات ضرب و انباشت ماتریس را انجام می دهد
// شکل: D = A * B + C .

به روز رسانی: AMD API جدید ROCm 5.2 HIP را با کتابخانه rocWMMA منتشر کرد همانطور که توسط گزارش شده است فورونیکس:

آیا این نشان می‌دهد که AMD در حال آماده‌سازی فناوری وضوح فوق‌العاده خود است که توسط الگوریتم‌های هوش مصنوعی تقویت شده است؟ اگر بله، پس AMD WMMA باید با هسته NVIDIA Tensor سازگار باشد، زیرا در غیر این صورت به فناوری اختصاصی دیگری تبدیل می‌شود که تنها توسط پردازنده‌های گرافیکی خود AMD پشتیبانی می‌شود.

AMD معادل Tensor Core داشته باشد

اگرچه این اولین معماری AMD نیست که از عملیات ماتریسی پشتیبانی می کند. AMD قبلاً از طریق معماری CDNA خود از آن پشتیبانی می کند. دستورالعملی به نام MFMA (Matrix-Fused-Multiply-Add) توسط این معماری محاسباتی پشتیبانی می شود. تفاوت در قالب ماتریس های پشتیبانی شده و فرمت های خروجی است. کد ارسال شده برای AMDGPU نشان می دهد که WMMA فقط از ماتریس های 16x16x16 پشتیبانی می کند و می تواند فرمت های داده FP16 و BF16 را تولید کند.

محمدصادق مجدی

majdi.ir

محمدصادق مجدی هستم عاشق سخت افزار کامپیوتر