AI视频赛道上,谷歌又再次放出王炸级更新!其推出的基于STUNet架构的AI视频大模型Lumiere可以直接生成5秒长的80帧视频。其中Space-Time U-Net(STUNet)架构解决了AI视频长度不足,运动连贯性和一致性很低,伪影重重等一系列问题。
相比ZeroScope和AnimateDiff分别仅生成3.6秒和2秒的视频而言,其应用场景大大增加。Lumiere实现了时长超过大多数流媒体中的平均镜头长度,也就是说用AI大模型流畅、完整的制作电影、视频等流媒体成为可能。
“有意见”留言板
@Pixel 9 Pro:改变都是要一点一点发生的,不仅要超越Gen-2、Pika,更要整合到产品。现在还是鼠标框选,几个月就变成手指圈点,定个小目标,狂甩iPhone几十条街。
@独木舟:针对这样的技术进步,我们也应该关注其可能带来的挑战,比如对隐私的影响、生成假视频(deepfakes)的潜在风险、以及对人类工作者的影响等,同步完善相关的法律法规。
好文章,需要你的鼓励
山东大学等高校联合研究揭示智能手机AI助手隐私保护能力严重不足。研究团队构建了首个隐私意识评估基准SAPA-Bench,包含7138个真实场景。测试结果显示,即使最佳模型的隐私风险感知能力也仅达67%,多数开源模型仅30%左右。研究发现闭源模型表现优于开源模型,明确提示可显著提升隐私感知能力。
英国研究人员开发出一项名为Fastball的三分钟检测技术,通过脑电图头戴设备分析大脑对图像的识别能力,能够在认知衰退早期发现记忆问题。研究涉及107名参与者,发现该技术可有效识别轻度认知障碍患者的记忆缺陷,比现有诊断工具提前10-20年发现阿尔茨海默病征象。该技术可在家中使用,为早期干预治疗提供可能。
香港理工大学等机构研究团队发现扩散语言模型存在"早期答案收敛"现象:高达99%的问题在推理中途就已得出正确答案,却仍继续无效推理。基于此发现,团队开发了Prophet方法,通过监控AI推理信心动态决定提前停止时机,实现3.4倍推理加速且几乎不损失准确性,为AI文本生成效率优化开辟新方向。