一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线

一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线

    正在检查是否收录...

还记得之前给大家推荐的中文语音AI天花板ChatTTS吗?这个可平替 GPT-4o的文本转语音项目一上线就爆火出圈,短短几天就在GitHub上斩获了16.9K的Star 量。

而现在,ChatTTS正式上线了官网,所有用户都可以直接在线体验了。

主要功能:

文字转语音:在文本框中输入文字,ChatTTS会生成对应的语音,并自动调整韵律和停顿。

实时语音对话:与大语言模型结合,实现实时语音对话功能。

调节音色:在“Audio Seed”处可以调节数字指定说话人的音色,或通过摇骰子随机生成一种音色。

控制细节:用户可以在文本中加入特殊标记如[laugh]和[uv_break],手动控制笑声和停顿等效果。

ChatTTS的突出特点

多语言支持:ChatTTS不仅支持中文,还能够生成自然流畅的英文语音。中英文混合语音表现出色,几乎听不出AI生成的痕迹。

细粒度控制:ChatTTS允许用户控制笑声、说话间的停顿以及语气词,使生成的语音更加自然和生动。

多说话人支持:ChatTTS支持多说话人的语音合成,可以复刻各种声音,包括已故人物的经典声音。

大规模训练数据:最大的ChatTTS模型使用了超过10万小时的中英文数据进行训练,在HuggingFace开源的版本使用了4万小时的训练数据,但未经过监督微调(SFT)。

ChatTTS的应用场景

ChatTTS适用于各种需要高质量语音合成的场景,包括但不限于:

电商直播:为直播提供更加自然的语音配音,提高用户体验。

自媒体:帮助自媒体创作者生成生动的配音,吸引更多观众。

在线教育:为在线课程提供清晰自然的讲解声音,提升学习效果。

客服和售后服务:提供更人性化的语音服务,提高客户满意度。

在线使用

官网地址:https://chattts.com/

项目地址:https://top.aibase.com/tool/chattts

text:指的是需要转换成语音的文字内容。

Refine text:选择是否自动对输入的文本进行优化处理。

随机度:一个控制输出随机性的参数,数值越大,生成的语音随机性越高,这可能导致生成的语音质量有时更好,有时更差。

声音选择:默认值为2222,这是一个数字参数,用于选择声音的类型。可选的数字有2222、7869、6653、4099、5099,可以任选其一,或者输入其他数字以随机选择声音。

定制声音:这是一个正整数参数,用于定制声音的音调和音色。如果设置了此值,将优先使用,而忽略声音选择参数。

提示设置:用于添加笑声、停顿等效果。例如,可以设置为[oral_2][laugh_0][break_6]。

再次强调,该模型的优势在于它是开源的,允许使用个人的声音资料进行训练。

使用时,请遵守法律法规和道德规范。

chattts语音对话语音合成自媒体训练数据中英文多语言支持在线体验满意度随机选择huggingface语言支持语音aigit语音配音客户满意度大语言模型在线教育github
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-15801.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

Stable Diffusion扩散模型【详解】小白也能看懂!!

上一篇

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

下一篇
  • 复制图片
按住ctrl可打开默认菜单