每日AIGC最新进展(24):用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D

每日AIGC最新进展(24):用于图像质量和审美评估的统一视觉-语言预训练模型UniQA、可控生成图像压缩框架Control-GIC、3D感知扩散模型Ouroboros3D

    正在检查是否收录...

Diffusion Models专栏文章汇总:入门与实战

UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment

本文提出了一种名为UniQA的统一视觉-语言预训练模型,用于图像质量和美学评估(IQA和IAA)。与现有方法独立处理这两个任务不同,UniQA通过学习与人类主观感知一致的通用感知表示,同时提升IQA和IAA任务的性能。该模型利用多模态大型语言模型(MLLMs)生成高质量的文本描述,以解决IQA数据集中缺少文本的问题,并净化IAA数据集中的噪声文本。

UniQA的构建包括几个关键步骤。首先,使用MLLMs为IQA和IAA数据集

数据集llmllmslmsmllms语言模型多模态大型语言模型高质量预训练模型diffusion预训练图像质量
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-17075.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

曝iPhone 16国行版将使用中国AI公司大模型:苹果还未找到伙伴

上一篇

Stable Diffusion文生图-图生图-ControINet插件-线稿上色-生产全套表情包-3D Openpose-局部重绘-换衣服,换姿势人设三视图一键生成教程大全

下一篇
  • 复制图片
按住ctrl可打开默认菜单