一款视频生成AI工具正在产业界形成风暴,那OpenAI这两天发布的名为“Sora”的工具。报道称Sora突破了传统视频制作的限制,能够理解文字提示词,并通过视觉艺术的形式呈现给人眼。
从技术上看,ChatGPT是通过提示词形成一个有逻辑的完整对话,Sora是通过提示词形成一个完整的3D虚拟世界, 那么Sora的出现就是循序渐进的量变产生的质变。OpenAI员工透露说,Sora短期内不会面世。如果这两天Sora呈现的效果不是特别选出来而是平均生成水准的话,那么未来虚拟世界会有无限精彩。
“有意见”留言板
@不倒翁:视频生成AI能力给大家带来惊艳,也给科学家们带来更多的未解之谜。比如经验主义的工程化的背后原理是什么?基于涌现的预测大模型为什么实现了推理能力? RLHF(人类反馈强化学习)大模型的作用是如何什么产生的?背后的理论、规律还在摸索中,期待AI领域的牛顿、爱因斯坦的到来!
@媒体搬运工:如果说文字是对世界的理解,那么视频就是现实的复刻了,AI更准确说是OpenAI正在不断试探人类的底线,我觉得全球应该抵制OpenAI这个“邪恶组织”了。
好文章,需要你的鼓励
悉尼大学和微软研究院联合团队开发出名为Spatia的创新视频生成系统,通过维护3D点云"空间记忆"解决了AI视频生成中的长期一致性难题。该系统采用动静分离机制,将静态场景保存为持久记忆,同时生成动态内容,支持精确相机控制和交互式3D编辑,在多项基准测试中表现优异。
33年后,贝尔纳多·金特罗决定寻找改变他人生的那个人——创造马拉加病毒的匿名程序员。这个相对无害的病毒激发了金特罗对网络安全的热情,促使他创立了VirusTotal公司,该公司于2012年被谷歌收购。这次收购将谷歌的欧洲网络安全中心带到了马拉加,使这座西班牙城市转变为科技中心。通过深入研究病毒代码和媒体寻人,金特罗最终发现病毒创造者是已故的安东尼奥·恩里克·阿斯托尔加。
马里兰大学研究团队开发ThinkARM框架,首次系统分析AI推理过程。通过将思维分解为八种模式,发现AI存在三阶段推理节律,推理型与传统AI思维模式差异显著。研究揭示探索模式与正确性关联,不同效率优化方法对思维结构影响各异。这为AI系统诊断、改进提供新工具。