视频无缝生成声音来了,Pika 模型可以根据视频内容生成相配的声音了。如果你有自己的想法,那么你可以给出提示,描述你想要的声音类型;或者直接让Pika根据视频内容自动生成。就是它可以根据你的画面自己生成声音,比如根据树林,生成鸟鸣,比如看到汽车,发出汽车嗡嗡的声音,比如看到烟花,会配上烟花爆竹的声音。
根据宣传来看,其声音效果高度与视频画面匹配。
“有意见”留言板
@辣腿堡不加酱:用户只需一个 prompt 或 简单的描述 就能用Sound Effects生成音效,这的确降低了视频产出的技术门槛,让更多的人能够不受技术束缚,展现自己的创意。至于对影视行业是否会造成冲击,也许会有,但对于高内涵的作品可能影响不大。正如机器翻译暂且达不到人工译者的“信”、“达”、“雅”一样,影视作品所想表现出的反讽或引发人们深思的内容,演员情绪细节的流露,都不是仅仅靠视频和音效生成软件加持就能冲击或超越的。
@媒体搬运工:生成式AI的大门打开之后就关不上了,从文字到音视频,当这些内容充斥互联网的时候,究竟是好事还是坏事呢?
好文章,需要你的鼓励
阿里云亮相MWC 2026,首次在国际舞台以“全球领先全栈AI服务商”身份登场,发布面向金融、医疗等高合规行业的百炼专属版,以千问开源生态、冬奥落地案例与7×24全球服务网络,向世界递出一张中国AI名片。
南华科技大学等顶尖院校联合发布的对角蒸馏技术实现了AI视频生成的重大突破,通过"前重后轻"的智能资源分配策略,在保持高质量的同时将生成速度提升277倍。该技术能在2.61秒内生成5秒视频,达到每秒31帧的流畅效果,有效解决了长视频生成中的质量衰减问题,为视频制作、教育内容创作等领域的实用化应用铺平了道路。
今天讲的出海案例是同享科技,一家做光伏焊带的北交所上市公司,2025 年 1 月以 600 万美元在马来西亚设立全资孙公司并投资建设生产基地,这是它在境外落下的第一条实体产线。
KRAFTON与KAIST联合研究揭示,当前最先进的AI视觉模型在识别图像间微妙差异方面存在显著不足。研究团队开发的VLM-SubtleBench测试平台显示,即使最好的AI模型准确率也仅有77.8%,远低于人类的95.5%。这一发现对医疗诊断、工业质检等需要精细视觉判断的关键应用领域具有重要警示意义。