微软推出NaturalSpeech2语音模型:零样本生成唱歌唱歌
来源:中关村在线 发布时间:2023-07-28 15:31:58


(资料图片)

微软近日推出了一款名为NaturalSpeech2的语音模型,该模型采用“潜在扩散”式设计,其在零样本语音合成层面的效果显著。微软表示,该模型提供了“商业级”的语音/歌唱解决方案,能够为用户提供高质量、多样化的语音合成体验。 微软对NaturalSpeech2进行了一系列演示,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格(如唱歌)的语音的能力。与传统的语音转文字(TTS)系统不同,NaturalSpeech2使用“连续向量”取代“离散标记”来表示语音,从而生成更完整的语音片段,不会产生“缺乏感情”的“棒读(一字一顿地讲话)”现象。 实验结果显示,NaturalSpeech2在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在LibriTTS和VCTK测试集上的自然度(以CMOS为度量)与真人语音难以区分。该项目的论文已经发布,感兴趣的人可以查阅。

标签:

猜你喜欢

微软推出NaturalSpeech2语音模型:零样本生成唱歌唱歌

微软近日推出了一款名为NaturalSpeech2的语音模型,该模型采用“潜在扩更多

2023-07-28 15:31:58

电信AI联盟成立 共同开发人工智能平台

7月28日,据韩国报道,韩国最大的电信运营商SK电讯在首尔华克山庄酒店更多

2023-07-28 15:35:31

15个接口!Alogic发布新款DV4桌面扩展坞

近日,Alogic在海外发布了新款DV4桌面扩展坞,售价约为1718元人民币。更多

2023-07-28 15:43:18

Twitter官方改logo 称更喜欢X字母

据网友反馈,社交平台Twitter在其安卓客户端10 0Beta版中,将原有的“更多

2023-07-28 15:34:04

《逆水寒》玩家数突破4000万 流水第二

手游MMORPG的玩家可能都听说过一个“热度魔咒”——大部分手游MMO刚开更多

2023-07-28 15:44:07

Win11更新引发问题:第三方应用可能导致开始菜单

7月27日,微软为Win11推送了KB5028254更新补丁,却意外引发了一个曾经更多

2023-07-28 15:33:35

暴雪加大监管力度:永久封号

据7月27日消息,尽管因之前的平衡补丁引发玩家大量差评,使《暗黑4》在更多

2023-07-28 15:43:18

完美世界:AI技术可加速工作效率 提高50%

自今年ChatGPT技术大受欢迎以来,AI取代人类工作的观点引发了广泛关注更多

2023-07-28 15:43:17

颐莲玻尿酸喷雾买一送一 69元包邮

颐莲旗舰店的颐莲玻尿酸喷雾300ml,原价79元,现在推出买一送一的优惠更多

2023-07-28 15:40:23

能充放电30,000次,寿命30年的“永久”电池技术公布

旧金山湾区的初创公司EnerVenue近日公布了一项创新的“永久”电池技术更多

2023-07-28 15:37:19