五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态 实践笔记

五一 Llama 3 超级课堂 | XTuner 微调 Llama3 图片理解多模态 实践笔记

    正在检查是否收录...

基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。

课程文档:Llama3-Tutorial/docs/llava.md at main · SmartFlowAI/Llama3-Tutorial · GitHub

环境、模型、数据准备

1.环境准备

使用之前课程中已经配置好的环境、XTuner和Llama3-Tutorial

2.模型准备

Llama3 权重:使用之前课程软链接过的Llama3-8B-Instruct

Visual Encoder 权重:Llava 所需要的 openai/clip-vit-large-patch14-336,权重,即 Visual Encoder 权重。(使用软链接)

Image Projector 权重

3.数据准备

微调

1.训练启动

使用XTuner启动基于Llama3的LLaVA训练
xtuner train ~/Llama3-Tutorial/configs/llama3-llava/llava_llama3_8b_instruct_qlora_clip_vit_large_p14_336_lora_e1_finetune.py --work-dir ~/llama3_llava_pth --deepspeed deepspeed_zero2

需要先安装deepspeed,重试

30%的A100好像不太够用,加上offload重试,启动成功

大约用时4个小时左右

将原始 image projector 和 我们微调得到的 image projector 都转换为 HuggingFace 格式
xtuner convert pth_to_hf ~/Llama3-Tutorial/configs/llama3-llava/llava_llama3_8b_instruct_qlora_clip_vit_large_p14_336_lora_e1_finetune.py \ ~/model/llama3-llava-iter_2181.pth \ ~/llama3_llava_pth/pretrain_iter_2181_hf xtuner convert pth_to_hf ~/Llama3-Tutorial/configs/llama3-llava/llava_llama3_8b_instruct_qlora_clip_vit_large_p14_336_lora_e1_finetune.py \ ~/llama3_llava_pth/iter_1200.pth \ ~/llama3_llava_pth/iter_1200_hf

2.效果比对

检验模型效果

问题1:Describe this image. 问题2:What is the equipment in the image?

Pretrain 模型
Finetune 后 模型
export MKL_SERVICE_FORCE_INTEL=1 xtuner chat /root/model/Meta-Llama-3-8B-Instruct \ --visual-encoder /root/model/clip-vit-large-patch14-336 \ --llava /root/llama3_llava_pth/iter_1200_hf \ --prompt-template llama3_chat \ --image /root/tutorial/xtuner/llava/llava_data/test_img/oph.jpg

原始模型回答不出第二个问题,经过微调后可以回答出来

llamaclipclictocode数据准备chatdocintelflowsmartopenai预训练多模态gitpromptgithubhuggingface
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-16412.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

OpenAI 宣布新领导层以推动增长

上一篇

Apple Intelligence完全指南:苹果AI个人智能化系统使用方法教程与免费下载体验入口

下一篇
  • 复制图片
按住ctrl可打开默认菜单