【Rust日报】2023-03-14 Rust实现的纯 CPU 运算的 LLaMA 模型

【Rust日报】2023-03-14 Rust实现的纯 CPU 运算的 LLaMA 模型

    正在检查是否收录...

Rust实现的纯 CPU 运算的 LLaMA 模型

我试图让 LLaMA 语言模型在纯 CPU实现上工作,灵感来自于这里的一个很棒的CPU实现:https://github.com/ggerganov/ggml,它可以运行GPT-J 6B模型。

在我的蹩脚的 OpenCL 的代码下,我的GTX 3090上可以实现每个 Token 耗时 270毫秒。在Ryzen 3950X上使用纯 CPU 和 OpenCL,我可以使每个 Token 700ms左右。而在没有任何 OpenCL 的情况下,只用纯Rust代码,加上我手写的一些 AVX2 实现,每个令牌大约1秒。所有这些都运行在LLaMA-7B模型上。

ReadMore: https://github.com/Noeda/rllama

Sqlx 编译速度分析

sqlx真的很好,但你肯定会对编译时间印象深刻。即使使用Ryzen 3700,cargo check 也需要比较长的时间才能运行结束,而这成了一个喝咖啡休息的好借口。我想要看下到底在这背后发生了什么。

ReadMore: https://cosmichorror.dev/posts/speeding-up-sqlx-compile-times/

Rust编码风格

这篇文章是高阶一点的针对 Rust 编码风格的讨论(因为它没有涉及到具体的细节),部分灵感来自于面向数据的设计,部分灵感来自于基于ML的函数式编程语言,我认为这很自然地适用于Rust,并使得 API 更人性化且灵活易于扩展。这不是什么高级的东西,但我希望这对刚接触Rust的人起到一些作用。

ReadMore: https://tzemanovic.gitlab.io/posts/rust-coding-style/

From 日报小组 Koalr

社区学习交流平台订阅:

Rustcc论坛: 支持rss

微信公众号:Rust语言中文社区

cpullamasqlgitgithubtokenapi交流平台urlcodingrss公众号6b模型微信公众号gangpt语言模型编程语言
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-1525.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

【多模态】4、Chinese CLIP | 专为中文图文匹配设计

上一篇

神经网络实用工具(整活)系列---使用OpenAI的翻译模型whisper实现语音(中、日、英等等)转中字,从此生肉变熟肉---提高篇(附带打包好的程序)

下一篇
  • 复制图片
按住ctrl可打开默认菜单