Meta AI 发布开源基准数据集OpenEQA 促进AI代理的 “体验智能”

Meta AI 发布开源基准数据集OpenEQA 促进AI代理的 “体验智能”

    正在检查是否收录...

Meta AI 研究人员今天发布了 OpenEQA,这是一个新的开源基准数据集,旨在衡量人工智能系统对 “体验式问答”(embodied question answering)的能力 —— 这种能力使人工智能系统能够理解现实世界,从而回答有关环境的自然语言问题。

这一数据集被 Meta 定位为 “体验智能” 领域的关键基准,其中包含超过1,600个关于180多个真实环境(如家庭和办公室)的问题。这些问题涵盖了七个问题类别,全面测试人工智能在对象和属性识别、空间和功能推理以及常识知识等技能方面的能力。

对于这一 “体验式问答”(EQA)任务,研究人员在今天发布的一篇论文中写道:“简单来说,EQA 是指在足够了解环境的情况下,以自然语言回答关于环境的问题。”

OpenEQA 项目位于人工智能的热门领域交汇处:计算机视觉、自然语言处理、知识表示和机器人技术。其最终愿景是开发能够感知和与世界互动、与人类进行自然交流,并利用知识帮助我们日常生活的人工智能代理。

研究人员在短期内看到了 “体验智能” 在两个主要应用方面的可能性。一种是嵌入增强现实眼镜或头戴式显示器中的人工智能助手,可以利用视频和其他传感器数据,实际上为用户提供了一种记忆力,能够回答诸如 “我把钥匙放在哪里了?” 之类的问题。另一种是移动机器人,可以自主探索环境以获取信息,例如搜索家中以回答 “我还有咖啡吗?” 这样的问题。

为了创建 OpenEQA 数据集,Meta 的研究人员首先收集了真实环境的视频数据和3D 扫描数据。然后,他们向人类展示了这些视频,并要求他们提出他们可能想要问一个能够访问这些视觉数据的人工智能助手的问题。

最终产生的1,636个问题全面测试了各种感知和推理能力。为了衡量人工智能代理的性能,研究人员使用大型语言模型自动评分,衡量人工智能生成的答案与人类答案的相似程度。

人工智能研究人员自然语言数据集智能代理智能系统智能助手人工智能助手机器人人工智能系统基准数据集自动评分大型语言模型语言处理计算机视觉语言模型自然语言处理智能生成增强现实基准数据
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-13043.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

大模型加持后,数字人“更像人”了吗?

上一篇

甲骨文宠儿力压GPT-4斩获竞技场首胜,不绑定厂商,不做聊天机器人,Transformer最年轻作者带飞大模型创业新星

下一篇
  • 复制图片
按住ctrl可打开默认菜单