OpenAI推出声音克隆新技术:复刻你的声音仅需15秒

OpenAI推出声音克隆新技术:复刻你的声音仅需15秒

    正在检查是否收录...

快科技3月31日消息,据媒体报道,OpenAI公司最近推出了一项革命性的声音克隆技术Voice Engine”。

据悉,Voice Engine通过文本输入和15秒的音频样本,便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。

这一技术的研发始于2022年,并已应用于公司现有的文本转语音API和Read Aloud功能中的预设语音。

OpenAI认为,Voice Engine技术对于多个领域具有重大意义。在阅读辅助和语言翻译方面,它能够提供更为自然的语音输出,增强用户体验。

同时,该技术对于言语障碍患者来说更是一大福音,能够帮助他们更顺畅地交流。例如,在布朗大学的一个试点项目中,该技术成功用于创建从学校项目录制的音频中提取的语音克隆,有效帮助了言语障碍学生。

然而,鉴于合成语音技术可能存在的滥用风险,OpenAI目前仅对少数可信合作伙伴开放小规模测试。通过这种方式,公司旨在深入了解技术的潜在应用,并评估可能带来的风险。

OpenAI也希望通过此举引发社会对合成语音负责任部署的广泛讨论,共同探索如何适应这一新型技术。

此外,为了确保技术的安全使用,OpenAI还采取了一系列安全措施。这些措施包括使用水印技术追踪音频来源,以及对系统的使用方式进行主动监控。

当产品正式推向市场时,公司将设立一个禁止语音列表”,以检测并阻止与名人声音过于相似的人工智能生成声音,从而避免潜在的版权和隐私问题。

openai合成语音人工智能阅读辅助媒体报道语音输出合作伙伴自然逼真文本输入声音克隆智能生成语音克隆语言翻译文本转语音用户体验api语音技术逼真的语音
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-12181.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

【亲测有效】Win11(23H2)重启后任务栏Copilot图标恢复

上一篇

论文如何降低AIGC:七大策略助力优化学术写作

下一篇
  • 复制图片
按住ctrl可打开默认菜单