近日,《壮志凌云2:独行侠》在戛纳电影节放映,影片中Tom Cruise和Val Kilmer重聚的一幕,引起了在场观众的强烈共鸣。然而在2015年,Kilmer因喉癌失去了声音,演艺生涯近乎跌入谷底。
转机发生在去年8月,一家名为Sonantic的英国科技公司称,通过人工智能语音克隆技术创造出了Kilmer的“原声”,Kilmer也在YouTube发布视频详细介绍了通过AI找回声音的过程。Sonantic的这一举动受到了很多称赞,但也有声音认为,该技术有违社会道德。
我们的科技留言板“有意见”如下
@不倒翁:AI模拟声音,AI构建虚拟人。目前AI技术已经实现了让人类的眼、耳分辨不出到底声音、图像是真实的、还是合成的。我认为这个时候特别需要区块链技术,来实现声音、人像等虚拟数据的溯源。来保证数据不被非法利用。
@长耳朵鱼:可以预料到声音克隆技术的商业前景,最明显的就是名人的声音价值,有了声音样本,似乎代言广告、直播带货、影视节目等更不需要真人了。
@独木舟/@周一见:在语音合成领域,由于AI克隆技术的出现,繁琐的配音工作有望被取代。但是克隆的声音,家人朋友都无法分辨,容易被不法之人利用,需要完善的法律法规制约。而对于特殊人群,利用AI重现声音可以说是雪中送炭了。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。