AI研究者成功通过“诗歌攻击”揭示ChatGPT的训练数据来源

AI研究者成功通过“诗歌攻击”揭示ChatGPT的训练数据来源

    正在检查是否收录...

来自 Google Deepmind、华盛顿大学、康奈尔大学、卡内基梅隆大学、加州大学伯克利分校和苏黎世联邦理工学院的一组研究人员成功地让 Open AI 的聊天机器人 Chat GPT 揭示了用于训练 AI 模型的一些数据。

研究团队使用了一种创新性的手法,即通过不断迭代地要求Chat GPT重复一个特定的词汇,比如“诗歌”,来引导模型透露其训练数据。随着反复迭代,Chat GPT最终开始输出与训练数据相关的信息。这包括来自CNN、Goodreads、Wordpress博客、Stack Overflow代码、Wikipedia文章等多个来源的文本内容。

图源备注:图片由AI生成,图片授权服务商Midjourney

更令人担忧的是,Chat GPT还被发现包含了大量从互联网上爬取的私人信息,这些信息甚至可以通过Chat GPT-3.5turbo的公开版本获得。攻击揭示的私密信息包括电话号码、传真号码、邮箱地址、物理地址、社交媒体用户名、网址、姓名和生日等。

研究人员表示,他们在8月30日通知了Open AI关于这一漏洞,并Open AI自那时起对其进行了修复。截至目前,Open AI尚未进一步评论此事。

值得注意的是,研究还涉及到AI生成文本和图像所消耗的能源问题。研究人员发现,使用AI模型生成1,000张图像的能耗相当于将手机充满电,而生成1,000次文本则相当于将手机充电至16%。该研究呼吁更加环保的AI使用方式,并指出大型、广泛应用的AI模型消耗的能源更多,因为它们试图同时执行多项任务,而非专注于特定任务。

这一研究为我们敲响了警钟,提醒我们在推动AI发展的同时,需谨慎处理其隐私和能源消耗的问题。

chat gptgptchatopen ai研究人员ai模型训练数据ai生成wordpress广泛应用社交媒体gpt-3.5wordai生成文本flow用户名聊天机器人wikipediagpt-3模型生成互联网midjourneygoogleai 模型机器人url
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-2399.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

【慕伏白教程】Linux系统本地部署stable-diffusion-webui

上一篇

ChatGPT:开启AI新纪元-人工智能AI

下一篇
  • 复制图片
按住ctrl可打开默认菜单