视频无缝生成声音来了,Pika 模型可以根据视频内容生成相配的声音了。如果你有自己的想法,那么你可以给出提示,描述你想要的声音类型;或者直接让Pika根据视频内容自动生成。就是它可以根据你的画面自己生成声音,比如根据树林,生成鸟鸣,比如看到汽车,发出汽车嗡嗡的声音,比如看到烟花,会配上烟花爆竹的声音。
根据宣传来看,其声音效果高度与视频画面匹配。
“有意见”留言板
@辣腿堡不加酱:用户只需一个 prompt 或 简单的描述 就能用Sound Effects生成音效,这的确降低了视频产出的技术门槛,让更多的人能够不受技术束缚,展现自己的创意。至于对影视行业是否会造成冲击,也许会有,但对于高内涵的作品可能影响不大。正如机器翻译暂且达不到人工译者的“信”、“达”、“雅”一样,影视作品所想表现出的反讽或引发人们深思的内容,演员情绪细节的流露,都不是仅仅靠视频和音效生成软件加持就能冲击或超越的。
@媒体搬运工:生成式AI的大门打开之后就关不上了,从文字到音视频,当这些内容充斥互联网的时候,究竟是好事还是坏事呢?
好文章,需要你的鼓励
开源数据库服务商Percona为PostgreSQL推出透明数据加密(TDE)扩展,填补了该数据库在企业级安全功能方面的空白。该pg_tde扩展目前已包含在Percona PostgreSQL发行版中,可加密磁盘上所有数据库文件,并支持与主流密钥管理服务集成。Percona正努力将此功能纳入PostgreSQL主发行版,帮助用户满足GDPR等法规的加密要求。
新加坡国立大学研究团队开发了SPIRAL框架,通过让AI与自己对弈零和游戏来提升推理能力。实验显示,仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%,通用推理提升8.4%,且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中,为AI训练提供了新思路。
西部数据首席产品与工程官Ahmed Shihab表示,公司HAMR技术进展顺利,OptiNAND能提供容量优势。HAMR技术物理原理已突破,正进行制造工艺优化。相比希捷10盘片技术,西数11盘片设计提供更大发展空间,可更快推向市场。OptiNAND结合UltraSMR算法可实现更高单盘容量。公司采取保守策略,注重可靠性,客户已完成相关软件认证。硬盘在数据经济中仍是基础,在视频监控等写密集型应用中具备成本和耐久性优势。
同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息,创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系,结合深度学习和数学优化方法,在合成数据集上实现37.9%的精度提升,并在真实设备上展现出色泛化能力,为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。