OpenAI在官网首次展示了全新自定义音频大模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,虽然在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强。但是至少中文听起来怪怪的。
Voice Engine目前的商业用途,包括帮助失去声音表达能力的人,正常发音说话。还可以给教育行业提供生成各种有声读物。以及帮助企业开发商品展示的“数字人进行各种翻译等。
“有意见”留言板
@媒体搬运工:前有Sora,现在出了Voice Engine,感觉OpenAI在有目的放出来,结合ChatGPT,从对话到视频到语音,OpenAI的AGI要闭环了。
@辣腿堡不加酱:帮助声音受损的人恢复声音在某种角度上真是件好事,但更多的担忧是会违规使用。毕竟现在通过打个电话发个语音消息采集到声音样本也不是件难事,安全性不好保证。
好文章,需要你的鼓励
谷歌深度思维团队开发出名为MolGen的AI系统,能够像经验丰富的化学家一样自主设计全新药物分子。该系统通过学习1000万种化合物数据,在阿尔茨海默病等疾病的药物设计中表现出色,实际合成测试成功率达90%,远超传统方法。这项技术有望将药物研发周期从10-15年缩短至5-8年,成本降低一半,为患者更快获得新药治疗带来希望。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
哈佛医学院和微软公司合作开发了一个能够"听声识病"的AI系统,仅通过分析语音就能预测健康状况,准确率高达92%。该系统基于深度学习技术,能够捕捉声音中与疾病相关的微妙变化,并具备跨语言诊断能力。研究团队已开发出智能手机应用原型,用户只需完成简单语音任务即可获得健康评估,为个性化健康管理开辟了新途径。