斯坦福用几百块钱训练的alpaca,体验一下基于llama的7b和13b模型,据说比gpt3.0还牛,结果怎样??你能信?

斯坦福用几百块钱训练的alpaca,体验一下基于llama的7b和13b模型,据说比gpt3.0还牛,结果怎样??你能信?

    正在检查是否收录...

好久没写代码了,上头了,强撸了!

1、自己买个GPU服务器(如果不训练,可以随便买个高内存的即可),有些网站很便宜,小时起租!

2、alpaca和模型下载地址:GitHub - antimatter15/alpaca.cpp: Locally run an Instruction-Tuned Chat-Style LLM

git clone GitHub - antimatter15/alpaca.cpp: Locally run an Instruction-Tuned Chat-Style LLM

cd alpaca.cpp

3、模型下载:ggml-alpaca-7b-q4.bin 、ggml-alpaca-13b-q4.bin ,不知道哪里下载的我可以放出网盘地址

4、编译:make chat

5、运行起来:./chat -m ggml-alpaca-13b-q4.bin ,记得放到同一个目录哦

7b效果如下:

虽然我的服务器配置相当可以了,但是速度还是不快哦!毕竟是斯坦福大学训练的模型,对中文的确支持的不好

13b效果如下:

后续:

1、中文的大语言模型已经有人训练出来了

2、中文的alpaca模型也训练出来了

3、上面两个模型搞定跑起来之后,是否能训练自己的模型呢?你猜

alpacachatgitllmgithub服务器大语言模型语言模型gpu斯坦福大学cloneurl
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-1191.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

图片变视频只需一“指”!Gen-2运动笔刷免费上线,网友:史上最强更新

上一篇

程序员眼中的 ChatGPT

下一篇
  • 复制图片
按住ctrl可打开默认菜单