游客
标签:
排序:
最新发布 最近更新 最多浏览 最多点赞 最多评论
公告
本文通过五个方面系统介绍了大模型量化技术:首先阐述量化的基本概念,以低比特(INT8/4/2/1)取代 FP32 的压缩与加速原理;其次按时间维度区分 PTQ、QAT 与 QA
0 10 0

没有更多啦

  • 复制图片
按住ctrl可打开默认菜单