近日,《壮志凌云2:独行侠》在戛纳电影节放映,影片中Tom Cruise和Val Kilmer重聚的一幕,引起了在场观众的强烈共鸣。然而在2015年,Kilmer因喉癌失去了声音,演艺生涯近乎跌入谷底。
转机发生在去年8月,一家名为Sonantic的英国科技公司称,通过人工智能语音克隆技术创造出了Kilmer的“原声”,Kilmer也在YouTube发布视频详细介绍了通过AI找回声音的过程。Sonantic的这一举动受到了很多称赞,但也有声音认为,该技术有违社会道德。
我们的科技留言板“有意见”如下
@不倒翁:AI模拟声音,AI构建虚拟人。目前AI技术已经实现了让人类的眼、耳分辨不出到底声音、图像是真实的、还是合成的。我认为这个时候特别需要区块链技术,来实现声音、人像等虚拟数据的溯源。来保证数据不被非法利用。
@长耳朵鱼:可以预料到声音克隆技术的商业前景,最明显的就是名人的声音价值,有了声音样本,似乎代言广告、直播带货、影视节目等更不需要真人了。
@独木舟/@周一见:在语音合成领域,由于AI克隆技术的出现,繁琐的配音工作有望被取代。但是克隆的声音,家人朋友都无法分辨,容易被不法之人利用,需要完善的法律法规制约。而对于特殊人群,利用AI重现声音可以说是雪中送炭了。
好文章,需要你的鼓励
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
AI改变的远不止一间课堂,而是学生的学习方式、未来的职场场景和社会对工作者能力的要求,整个商业文明中的每一位参与者,都将被推着一起改变。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。