اطلاعات تماس

تهران - خیابان آفریقا - کوچه کمان - پلاک 10

24/7 در دسترس هستیم

AMD نسخه 6.3 ROCm را معرفی کرده است که بسیاری از به روز رسانی های جدید را به اکوسیستم ROCm اضافه می کند. آخرین نسخه پشته درایور منبع باز دارای چندین اضافه شده است، از جمله SGLang، FlashAttention-2، و یک کامپایلر Fortran.

SGLang یک زمان اجرا جدید در ROCm 6.3 است که ظاهراً تأخیر، توان عملیاتی و استفاده از منابع را با بهینه‌سازی مدل‌های هوش مصنوعی «پیش‌گام» روی پردازنده‌های گرافیکی Instinct خانگی AMD بهبود می‌بخشد. ظاهراً SGLang تا 6 برابر عملکرد بالاتری را در استنباط مدل زبانی بزرگ به دست می‌آورد و با کانتینرهای Docker از پیش پیکربندی شده‌ای عرضه می‌شود که از Python برای تسریع هوش مصنوعی، گردش‌های کاری چندوجهی و پشتیبان‌های ابری مقیاس‌پذیر استفاده می‌کنند.

FlashAttention-2 تکرار بعدی FlashAttention است که استفاده از حافظه و نیازهای محاسباتی را با مدل های Transformer AI کاهش می دهد. FlashAttention-2 ظاهراً تا 3 برابر افزایش سرعت نسبت به نسخه یک برای پاس‌های عقب و جلو دارد که زمان آموزش مدل هوش مصنوعی را تسریع می‌کند.

AMD یک کامپایلر Fortran را در ROCm 6.3 پیاده‌سازی کرده است که به کاربران امکان می‌دهد برنامه‌های قدیمی مبتنی بر Fortran را روی پردازنده‌های گرافیکی Instinct مدرن AMD اجرا کنند. کامپایلر دارای بارگذاری مستقیم GPU از طریق OpenMP برای بارهای کاری علمی، سازگاری با عقب به توسعه دهندگان برای ادامه نوشتن کد فرترن برای برنامه های قدیمی موجود و ادغام ساده با هسته های HIP و کتابخانه های ROCm است.

پشتیبانی از Multi-NodeFFT محاسبات FFT توزیع شده با کارایی بالا را در ROCm 6.3 فعال می کند. ظاهراً این ویژگی مقیاس‌گذاری چند گره را ساده می‌کند، پیچیدگی توسعه‌دهندگان را کاهش می‌دهد و مقیاس‌پذیری یکپارچه را در میان مجموعه‌های داده عظیم ممکن می‌سازد.

ROCm 6.3 پیشرفت‌هایی را در کتابخانه‌های بینایی رایانه rocDecode، rocJPEG و rocAL معرفی می‌کند که پشتیبانی از کدک AV1، رمزگشایی JPEG با شتاب GPU و تقویت صدا را بهتر می‌کند.

ROCm یک پشته منبع باز از نرم افزار و درایورهایی است که برای اجرا بر روی پردازنده های گرافیکی AMD Instinct طراحی شده است. هدف این پلتفرم ارائه ویژگی‌هایی است که برنامه‌های کاربردی شتاب‌دهنده GPU سازمانی مانند محاسبات با عملکرد بالا (HPC)، AI/Machine Learning، ارتباطات و موارد دیگر را فعال یا بهبود می‌بخشد.

منبع:tomshardware

به اشتراک بگذارید:

administrator

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *