一款视频生成AI工具正在产业界形成风暴,那OpenAI这两天发布的名为“Sora”的工具。报道称Sora突破了传统视频制作的限制,能够理解文字提示词,并通过视觉艺术的形式呈现给人眼。
从技术上看,ChatGPT是通过提示词形成一个有逻辑的完整对话,Sora是通过提示词形成一个完整的3D虚拟世界, 那么Sora的出现就是循序渐进的量变产生的质变。OpenAI员工透露说,Sora短期内不会面世。如果这两天Sora呈现的效果不是特别选出来而是平均生成水准的话,那么未来虚拟世界会有无限精彩。
“有意见”留言板
@不倒翁:视频生成AI能力给大家带来惊艳,也给科学家们带来更多的未解之谜。比如经验主义的工程化的背后原理是什么?基于涌现的预测大模型为什么实现了推理能力? RLHF(人类反馈强化学习)大模型的作用是如何什么产生的?背后的理论、规律还在摸索中,期待AI领域的牛顿、爱因斯坦的到来!
@媒体搬运工:如果说文字是对世界的理解,那么视频就是现实的复刻了,AI更准确说是OpenAI正在不断试探人类的底线,我觉得全球应该抵制OpenAI这个“邪恶组织”了。
好文章,需要你的鼓励
苹果为多个Magic Keyboard型号发布固件更新,涵盖M4和M5 iPad Pro的11英寸和13英寸版本,以及为M3 iPad Air设计的11和13英寸Magic Keyboard。虽然这类更新不常见,但通常包含重要的漏洞修复、安全更新以及可靠性和性能改进。目前苹果尚未公布详细更新说明。用户可通过设置查看当前固件版本。
德国MPI信息学院等机构联合研究发现,当前先进的大型视觉语言模型在处理多张图片时存在严重局限:无法有效整合跨图片信息、难以同时追踪多个概念、易被干扰图片影响。研究团队通过MIMIC测试平台系统分析了这些问题,并提出数据驱动和注意力掩蔽两种解决方案,显著提升了AI的多图像理解能力,为未来多模态AI系统发展提供重要技术路径。
马斯克表示特斯拉将重启此前放弃的第三代AI芯片Dojo3项目,但这次不是用于地面自动驾驶模型训练,而是专门用于"太空AI计算"。五个月前特斯拉曾关闭Dojo项目并解散团队。马斯克称重启决定基于内部AI5芯片设计进展良好。他计划利用SpaceX的星舰发射计算卫星群,在太空中24小时利用太阳能运行AI数据中心,认为这是未来发展方向。
复旦大学团队构建的ABC-Bench是首个专门评估AI代码智能体完整后端开发能力的基准测试。该基准包含224个来自真实项目的任务,涵盖8种编程语言和19种框架,要求AI完成从仓库探索到服务部署的全流程开发。测试结果显示,即使最先进的Claude Sonnet 4.5模型通过率也仅63.2%,环境配置成为主要瓶颈,揭示了AI代码助手与实际工程需求间的显著差距。