[算法前沿]--005-和chatgpt一样的大模型LLaMA可以运行在pc上?

[算法前沿]--005-和chatgpt一样的大模型LLaMA可以运行在pc上?

    正在检查是否收录...

未来已来,大模型依据压缩模型的方式,可以在普通的PC上运行.

LLaMA

Facebook的LLaMA 模型和Georgi Gerganov 的llama.cpp的结合。 LLaMA,这是一组包含 7B 到 65B 参数的基础语言模型。我们在数万亿个令牌上训练我们的模型,并表明可以仅使用公开可用的数据集来训练最先进的模型,而无需诉诸专有和不可访问的数据集。特别是,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),而 LLaMA-65B 可与最佳模型 Chinchilla-70B 和 PaLM-540B 竞争。我们将所有模型发布给研究社区。

论文

4位量化是一种减小模型大小的技术,因此它们可以在功能较弱的硬件上运行。它还减少了磁盘上的模型大小——7B 模型减少到 4GB,13B 模型减少到不到 8GB。 它完全有效!今晚我用它在我的笔记本电脑上运行 7B LLaMA 模型,然后今天早上升级到 13B 模型——Facebook 声称可以与 GPT-3 竞争的模型。

论文地址:Large language models are having their Stable Diffusion moment right now.

步骤

1.下载模型: 1) 种子下载方式 2) 签署的方式

搭建步骤

 $ git clone https://github.com/ggerganov/llama.cpp $ cd llama.cpp $ docker

llamagpt数据集gpt-3ganfacebookcodegitpalmclonedoc笔记本电脑大模型diffusiondocker语言模型笔记本githubstable diffusionurl
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-5882.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞

上一篇

CNET的发行商因AI丑闻而难以出售

下一篇
  • 复制图片
按住ctrl可打开默认菜单