元象大模型开源30款量化版本 可更低成本部署

元象大模型开源30款量化版本 可更低成本部署

    正在检查是否收录...

元象大模型开源了30款量化版本,支持 vLLM 和 llama.cpp 等主流框架的量化推理,无条件免费商用。

对量化前后的模型能力、推理性能进行评估,以 XVERSE-13B-GPTQ-Int4量化版本为例,量化后模型权重压缩了72%,总吞吐提高了1.5倍,同时保留了95% 的能力。

开发者可以根据技能、软硬件配置和具体需求选择不同推理框架和数据精度的模型。如果本地资源有限,可以直接调用元象大模型的 API 服务(chat.xverse.cn)。

总体来说,元象大模型的开源量化版本提供了方便快捷的部署方式,可以根据需求选择不同的框架和精度模型进行部署和推理。

元象大模型下载:

Hugging Face:https://huggingface.co/xverse

ModelScope魔搭:https://modelscope.cn/organization/xverse

Github:https://github.com/xverse-ai

大模型githubgitgptapillm开发者ganchatllamahugging facehuggingfaceapi 服务
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-12011.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

AI实用工具推荐-AI绘画工具篇

上一篇

Sam Altman断言:核聚变是解决AI能源需求的终极答案

下一篇
  • 复制图片
按住ctrl可打开默认菜单