AMD نسخه 6.3 ROCm را معرفی کرده است که بسیاری از به روز رسانی های جدید را به اکوسیستم ROCm اضافه می کند. آخرین نسخه پشته درایور منبع باز دارای چندین اضافه شده است، از جمله SGLang، FlashAttention-2، و یک کامپایلر Fortran.
SGLang یک زمان اجرا جدید در ROCm 6.3 است که ظاهراً تأخیر، توان عملیاتی و استفاده از منابع را با بهینهسازی مدلهای هوش مصنوعی «پیشگام» روی پردازندههای گرافیکی Instinct خانگی AMD بهبود میبخشد. ظاهراً SGLang تا 6 برابر عملکرد بالاتری را در استنباط مدل زبانی بزرگ به دست میآورد و با کانتینرهای Docker از پیش پیکربندی شدهای عرضه میشود که از Python برای تسریع هوش مصنوعی، گردشهای کاری چندوجهی و پشتیبانهای ابری مقیاسپذیر استفاده میکنند.
FlashAttention-2 تکرار بعدی FlashAttention است که استفاده از حافظه و نیازهای محاسباتی را با مدل های Transformer AI کاهش می دهد. FlashAttention-2 ظاهراً تا 3 برابر افزایش سرعت نسبت به نسخه یک برای پاسهای عقب و جلو دارد که زمان آموزش مدل هوش مصنوعی را تسریع میکند.
AMD یک کامپایلر Fortran را در ROCm 6.3 پیادهسازی کرده است که به کاربران امکان میدهد برنامههای قدیمی مبتنی بر Fortran را روی پردازندههای گرافیکی Instinct مدرن AMD اجرا کنند. کامپایلر دارای بارگذاری مستقیم GPU از طریق OpenMP برای بارهای کاری علمی، سازگاری با عقب به توسعه دهندگان برای ادامه نوشتن کد فرترن برای برنامه های قدیمی موجود و ادغام ساده با هسته های HIP و کتابخانه های ROCm است.
پشتیبانی از Multi-NodeFFT محاسبات FFT توزیع شده با کارایی بالا را در ROCm 6.3 فعال می کند. ظاهراً این ویژگی مقیاسگذاری چند گره را ساده میکند، پیچیدگی توسعهدهندگان را کاهش میدهد و مقیاسپذیری یکپارچه را در میان مجموعههای داده عظیم ممکن میسازد.
ROCm 6.3 پیشرفتهایی را در کتابخانههای بینایی رایانه rocDecode، rocJPEG و rocAL معرفی میکند که پشتیبانی از کدک AV1، رمزگشایی JPEG با شتاب GPU و تقویت صدا را بهتر میکند.
ROCm یک پشته منبع باز از نرم افزار و درایورهایی است که برای اجرا بر روی پردازنده های گرافیکی AMD Instinct طراحی شده است. هدف این پلتفرم ارائه ویژگیهایی است که برنامههای کاربردی شتابدهنده GPU سازمانی مانند محاسبات با عملکرد بالا (HPC)، AI/Machine Learning، ارتباطات و موارد دیگر را فعال یا بهبود میبخشد.
منبع:tomshardware