中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

    正在检查是否收录...
一言准备中...

中山大学HCP实验室联合Sea AI Lab和哈佛大学等单位开展的一项研究,成功地让大型人工智能模型通过讲笑话的方式,探索多模态大模型的创造力,并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。

这项研究的关键在于使用来自日本的“大喜利”(Oogiri)创新响应游戏作为数据源。传统的大模型,如GPT-4,处理这类任务时往往表现得过于正经,缺乏幽默感。而中山大学的“梗王大模型”则能够根据图像或文本输入,生成具有幽默感和创意的响应。

项目页:https://top.aibase.com/tool/clot

论文地址:https://arxiv.org/pdf/2312.02439.pdf

“大喜利”游戏要求玩家对提供的多模态内容(如问题、图像等)给出幽默和创意的回应。例如,一张老人向年轻人求助的图片,传统回应可能是询问路线,而“大喜利”风格的回应可能是请求帮助解开手铐,这种出人意料的回答具有强烈的幽默冲击感。

研究团队采用了一种新的非顺序、创造性思维范式——跳跃思维(Leap-of-Thought,LoT),以及一套基于此范式的训练方法CLoT。CLoT包括关联性指令微调和探索性自我调整两个阶段,旨在激发模型的创新响应能力。

性能评估方面,CLoT在Oogiri-GO数据集上的选择题和排序题评估中,显著提高了多模态大模型的性能,并超越了包括GPT-4在内的其他先进模型。用户调查也证实了CLoT在生成幽默内容方面的优越性。此外,CLoT在其他任务如“看云猜物CGG”和“发散思维测试DAT”中也展现了良好的泛化能力。

中山大学人机物智能融合实验室(HCP Lab)由林倞教授于2010年创立,专注于多模态内容理解、因果及认知推理、具身学习等领域的研究,并取得了丰富的学术成果。此次研究的成功,不仅展示了该实验室在AI领域的创新能力,也为未来的人工智能研究提供了新的思路和方法。

多模态大模型人工智能oogirigpt-4gptpdf智能研究创造性arxiv模式识别内容理解性能评估文本输入智能模型选择题年轻人数据源泛化能力数据集
  • 本文作者:WAP站长网
  • 本文链接: https://wapzz.net/post-13049.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.7W+
9
1
2
WAP站长官方

JS 的 AI 时代来了

上一篇

Gartner揭示2024年GenAI网络安全主要趋势

下一篇
  • 复制图片
按住ctrl可打开默认菜单