视频无缝生成声音来了,Pika 模型可以根据视频内容生成相配的声音了。如果你有自己的想法,那么你可以给出提示,描述你想要的声音类型;或者直接让Pika根据视频内容自动生成。就是它可以根据你的画面自己生成声音,比如根据树林,生成鸟鸣,比如看到汽车,发出汽车嗡嗡的声音,比如看到烟花,会配上烟花爆竹的声音。
根据宣传来看,其声音效果高度与视频画面匹配。
“有意见”留言板
@辣腿堡不加酱:用户只需一个 prompt 或 简单的描述 就能用Sound Effects生成音效,这的确降低了视频产出的技术门槛,让更多的人能够不受技术束缚,展现自己的创意。至于对影视行业是否会造成冲击,也许会有,但对于高内涵的作品可能影响不大。正如机器翻译暂且达不到人工译者的“信”、“达”、“雅”一样,影视作品所想表现出的反讽或引发人们深思的内容,演员情绪细节的流露,都不是仅仅靠视频和音效生成软件加持就能冲击或超越的。
@媒体搬运工:生成式AI的大门打开之后就关不上了,从文字到音视频,当这些内容充斥互联网的时候,究竟是好事还是坏事呢?
好文章,需要你的鼓励
苹果为多个Magic Keyboard型号发布固件更新,涵盖M4和M5 iPad Pro的11英寸和13英寸版本,以及为M3 iPad Air设计的11和13英寸Magic Keyboard。虽然这类更新不常见,但通常包含重要的漏洞修复、安全更新以及可靠性和性能改进。目前苹果尚未公布详细更新说明。用户可通过设置查看当前固件版本。
德国MPI信息学院等机构联合研究发现,当前先进的大型视觉语言模型在处理多张图片时存在严重局限:无法有效整合跨图片信息、难以同时追踪多个概念、易被干扰图片影响。研究团队通过MIMIC测试平台系统分析了这些问题,并提出数据驱动和注意力掩蔽两种解决方案,显著提升了AI的多图像理解能力,为未来多模态AI系统发展提供重要技术路径。
马斯克表示特斯拉将重启此前放弃的第三代AI芯片Dojo3项目,但这次不是用于地面自动驾驶模型训练,而是专门用于"太空AI计算"。五个月前特斯拉曾关闭Dojo项目并解散团队。马斯克称重启决定基于内部AI5芯片设计进展良好。他计划利用SpaceX的星舰发射计算卫星群,在太空中24小时利用太阳能运行AI数据中心,认为这是未来发展方向。
复旦大学团队构建的ABC-Bench是首个专门评估AI代码智能体完整后端开发能力的基准测试。该基准包含224个来自真实项目的任务,涵盖8种编程语言和19种框架,要求AI完成从仓库探索到服务部署的全流程开发。测试结果显示,即使最先进的Claude Sonnet 4.5模型通过率也仅63.2%,环境配置成为主要瓶颈,揭示了AI代码助手与实际工程需求间的显著差距。