游客發(fā)表

加速替代CUDA！摩爾線程開源vLLM

發(fā)帖時(shí)間：2024-12-29 14:37:19

[綜合] 來源：下愚不移網(wǎng)

11月5日消息，加速近日，替代摩爾線程上線了大語言模型高速推理框架開源項(xiàng)目vLLM的線程MUSA移植版本，為開發(fā)者提供基于摩爾線程全功能GPU進(jìn)行開源項(xiàng)目MUSA移植的開源范例。

摩爾線程表示，加速正努力圍繞自主研發(fā)的替代統(tǒng)一系統(tǒng)架構(gòu)GPU、MUSA軟件平臺(tái)，線程構(gòu)建完善好用的開源MUSA應(yīng)用生態(tài)。

加速替代CUDA！摩爾線程開源vLLM

vLLM是加速一個(gè)高效且易用的大模型推理和服務(wù)框架，支持創(chuàng)新的替代PagedAttention內(nèi)存管理、連續(xù)批處理請(qǐng)求、線程CUDA/HIP圖的開源快速模型執(zhí)行、CUDA核心優(yōu)化、加速分布式推理支持等，替代可顯著提高大語言模型（LLM）的線程推理性能。

目前，vLLM已在各種大語言模型中得到廣泛應(yīng)用，成為業(yè)界常用的開源大模型推理框架。

摩爾線程基于vLLM v0.4.2版本，進(jìn)行了移植適配，使之支持摩爾線程GPU后端Device，并完全開源，開發(fā)者可以二次開發(fā)、升級(jí)vLLM到社區(qū)更新版本等。

值得一提的是，得益于摩爾線程MUSA架構(gòu)的先進(jìn)性、軟件棧對(duì)CUDA的優(yōu)良兼容性，通過MUSIFY代碼自動(dòng)轉(zhuǎn)換工具，用戶可以快捷地將原有的CUDA代碼遷移到MUSA平臺(tái)，實(shí)現(xiàn)替代。

同時(shí)，CUDA相關(guān)庫的調(diào)用，也可以快速替換為相應(yīng)的MUSA加速庫，如算子庫muDNN、集合通信庫MCCL、線性代數(shù)庫muBLAS等。

摩爾線程通過MUSA軟件棧對(duì)CUDA軟件棧接口兼容，大幅提升了應(yīng)用移植的效率，縮短了開發(fā)周期，還提供MUSIFY自動(dòng)代碼移植工具等一系列實(shí)用工具和腳本。

摩爾線程vLLM-MUSA開源地址：

https://github.com/MooreThreads/vLLM_musa

分享到：新浪微博 QQ空間騰訊微博人人網(wǎng) 點(diǎn)點(diǎn)網(wǎng) 復(fù)制網(wǎng)址打印

相關(guān)內(nèi)容

現(xiàn)役身體素質(zhì)天花板！阿門
[流言板]艱難！掘金末節(jié)剩11分鐘時(shí)已無暫停，最終加時(shí)完成17分逆轉(zhuǎn)
交易市場(chǎng)解讀：頂薪球員想挪窩不容易改變聯(lián)盟格局靠3D側(cè)翼
[流言板]拉科布：鮑爾愛德華茲不一定在勇士有同樣表現(xiàn)，選秀看未來
【XP氵】從某種意義上來說，這樣的設(shè)定是不是還挺澀的？
[流言板]美記：老鷹希望交易卡佩拉以尋求陣容升級(jí)
灰熊18次6人得分上雙聯(lián)盟第一獨(dú)行俠13勝1負(fù)戰(zhàn)績(jī)極佳
無邊框iPhone已在路上：蘋果遇到了技術(shù)難題

亚洲嫩模在线观看,日韩视频特黄色大片,乱色中文视频在线,动漫免费观看

加速替代CUDA！摩爾線程開源vLLM

加速替代CUDA！摩爾線程開源vLLM