OpenAI在官网首次展示了全新自定义音频大模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,虽然在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强。但是至少中文听起来怪怪的。
Voice Engine目前的商业用途,包括帮助失去声音表达能力的人,正常发音说话。还可以给教育行业提供生成各种有声读物。以及帮助企业开发商品展示的“数字人进行各种翻译等。
“有意见”留言板
@媒体搬运工:前有Sora,现在出了Voice Engine,感觉OpenAI在有目的放出来,结合ChatGPT,从对话到视频到语音,OpenAI的AGI要闭环了。
@辣腿堡不加酱:帮助声音受损的人恢复声音在某种角度上真是件好事,但更多的担忧是会违规使用。毕竟现在通过打个电话发个语音消息采集到声音样本也不是件难事,安全性不好保证。
好文章,需要你的鼓励
2022年至2032年期间,预付旅行卡产生的收入将翻两番,从1205亿美元增至4928亿美元,这一急剧上升的趋势很大程度上是由于国际旅行的增加,因为游客人数缓慢攀升到了疫情前的水平。
生成式AI为电子游戏开发者带来令人兴奋的全新方法,帮助其创作引人入胜的内容、逼真的视觉效果以及身临其境般的游戏体验。在本文中,我们将通过一系列实例探讨生成式AI如何增强并加速游戏开发。
据《华尔街日报》近日报道,IBM公司正在就收购基础设施管理供应商HashiCorp公司进行深入谈判。