一文带你UI界面玩转ChatGLM以及Llama的微调

一文带你UI界面玩转ChatGLM以及Llama的微调

    正在检查是否收录...

Lora微调的概念:

        lora是Low-Rank Adaptation的缩写,是微软的Hu等人于2021年挂在ArXiv上(后又发表在ICLR2022上)的一篇论文《LoRA: Low-Rank Adaptation of Large Language Models》中提出的,通俗来讲,是一种降低模型可训练参数,又尽量不损失模型表现的大模型微调方法。为什么时隔两年,lora又突然火了一把呢?这一切都要感谢ChatGPT。

        这里就简单介绍这么多,LORA微调系列(一):LORA和它的基本原理 - 知乎 (zhihu.com)这篇文章讲解的非常详细,有兴趣的同学可以去看一看。随着大模型的爆火,lora已经成为必不可少的工具之一了。下面就开始讲述如何在UI页面可视化的微调大模型。

step 1 下载源码

        ChatGLM的微调

 git clone https://github.com/hiyouga/ChatGLM-Efficient-Tuning.git

        Llama的微调:

git clone https://github.com/hiyouga/LLaMA-Efficient-Tuning.git

step 2 准备数据集

        准备好数据集(json文件),放入./ChatGLM-Efficient-Tuning-main/data文件夹中

Step 3 查看数据集SHA-1哈希值

 sha1sum /path/to/your/file.txt

Step 4 添加数据集

        将SHA-1哈希值添加到dataset_info.json文件中,例如:

"alpaca_gpt4_zh": { "file_name": "alpaca_gpt4_data_zh.json", "file_sha1": "3eaa3bda364ccdd59925d7448a698256c31ef845" },

Step 5 运行程序

安装依赖:

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple 

 运行程序:

python ./ChatGLM-Efficient-Tuning-main/src/train_web.py

Step 6 修改参数&运行

        UI页面:

Step 6.1 训练

        1.修改Model Path:本地模型的地址

        2.修改Fintuning method:微调方式(默认为lora)

        3.选择需要训练的数据集

        4.修改以下的超参数:

                Learning rate:学习率(e-3~e-5),Epochs,Batchsize,Save steps

                这里的Save steps是每多少步就保存一次Checkpoint文件。例如有3000个Total steps,Save steps为1000,那么就是每1000个step就保存一次Checkpoint文件,最后一共三个文件。

        5.开始训练: 点击start

Step 6.2 测试

        点击Evaluate,选择数据集,修改相关的参数,点start

Step 6.3 Chat

        点击Load model(可以实时的查看微调结果或者模型结果)

Step 6.4 导出模型

        输入导出模型的地址,以及模型最大文件的大小。

Llama的微调方式和ChatGLM的微调方式一样,这里就不多赘述了。

最后,希望大家都可以炼丹成功!!!

codechatgit数据集大模型gptllamajsongpt4githubclonealpacaurlchatgpt文件夹web可视化模型微调pythonarxiv
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-4581.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

win10部署NovelAI绘画,Stable Diffusion,Chilloutmix,实现txt2img,img2img(含调参)

上一篇

ai绘画有哪些软件,盘点三款免费且超级好用的AI绘画工具

下一篇
  • 复制图片
按住ctrl可打开默认菜单