会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 加速替代CUDA!摩尔线程开源vLLM!

加速替代CUDA!摩尔线程开源vLLM

时间:2024-12-25 23:40:51 来源:创业垂统网 作者:百科 阅读:566次

11月5日消息,加速近日,替代摩尔线程上线了大语言模型高速推理框架开源项目vLLM的线程MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的开源范例。

摩尔线程表示,加速正努力围绕自主研发的替代统一系统架构GPU、MUSA软件平台,线程构建完善好用的开源MUSA应用生态。 

加速替代CUDA!摩尔线程开源vLLM

vLLM是加速一个高效且易用的大模型推理和服务框架,支持创新的替代PagedAttention内存管理、连续批处理请求、线程CUDA/HIP图的开源快速模型执行、CUDA核心优化、加速分布式推理支持等,替代可显著提高大语言模型(LLM)的线程推理性能。

目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。

摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。

值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。

同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。

摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。

摩尔线程vLLM-MUSA开源地址:

https://github.com/MooreThreads/vLLM_musa

(责任编辑:热点)

相关内容
  • 铭凡推出UN1250迷你主机:酷睿i5
  • 博格巴:我是个输不起的人但绝不是一个骗子永远不会喜欢作弊
  • [流言板]里弗斯:外界可能在担心,但我向你保证,球队内部毫无担忧
  • 《Dead Season》登陆Steam 丧尸末日回合制战术
  • 相比之前的游戏 《四海兄弟:故乡》将更加乡村化
  • 巴媒:萨维尼奥无缘本周末英超,但预计可代表巴西出战世预赛
  • 外形超科幻!“白帝空天战机”亮相珠海航展:可冲破大气层 进入外太空
  • 经典游戏重置版《蒙特祖玛的复仇 40周年纪念版》上架Steam
推荐内容
  • [流言板]生涯之夜!贾科比全场18投9中,得到27分2篮板3助攻
  • 《MainFrames》登陆Steam 桌面创意玩法休闲解谜
  • [流言板]SGA昨日8次失误追平生涯最高,且为其近4年单场最高失误数
  • 左腿腘绳肌受伤!西媒:赫罗纳攻击手丹朱马预计伤缺5
  • 恩比德:因伤缺阵期间乔治对我的支持很棒 这会推动我继续前进
  • 格斗游戏《全职猎人NEN×IMPACT》公布甘舒参战预告