有意见 | 音频大模型Voice Engine来了,但是中文发音满满的机械味! 原创

OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。

OpenAI在官网首次展示了全新自定义音频大模型“Voice Engine”。

用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,虽然在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强。但是至少中文听起来怪怪的。

Voice Engine目前的商业用途,包括帮助失去声音表达能力的人,正常发音说话。还可以给教育行业提供生成各种有声读物。以及帮助企业开发商品展示的“数字人进行各种翻译等。

“有意见”留言板

@媒体搬运工:前有Sora,现在出了Voice Engine,感觉OpenAI在有目的放出来,结合ChatGPT,从对话到视频到语音,OpenAI的AGI要闭环了。

@辣腿堡不加酱:帮助声音受损的人恢复声音在某种角度上真是件好事,但更多的担忧是会违规使用。毕竟现在通过打个电话发个语音消息采集到声音样本也不是件难事,安全性不好保证。

来源:至顶网有意见频道

0赞

好文章,需要你的鼓励

2024

04/01

17:09

分享

点赞

邮件订阅