过去一年,横空出世的ChatGPT成为2023年最热话题,今年龙年开年,OpenAI文生视频Sora对世界的模拟呈现能力让全球震撼。而这种震撼或者给人们带来压力不是技术本身,而是Sora模型具备的不可思议的进化速度。
当然对于OpenAI CEO 萨姆·奥尔特曼(Sam Altman)而言最关心的还是算力,因为视频模型的训练会比语言模型更加耗费算力。据外媒报道,奥尔特曼计划筹集夸张的 5 万亿-7 万亿美元以提高全球芯片制造能力,来应对生成AI的进化速度。可见Sora进化速度有多快,奥尔特曼的压力就有多大。
“有意见”留言板
@媒体搬运工:唯利是图才是驱动AI发展的最大动力,2023年一整年国内都在围着大模型转,今年大模型会如何发展还是挺有悬念的,这个Sora文生视频好像在合规方面比单纯的文字更具挑战,这样国内企业应该不会那么快跟进,虽然我们有海量的视频资源。
@辣腿堡不加酱:不论技术多新,真正能落地应用才有价值。对于那些被课程割韭菜的人们,背后是敏锐好学,还是无知焦虑?
好文章,需要你的鼓励
Luminary Cloud宣布完成7200万美元B轮融资,专注开发"物理AI"技术。该公司云原生平台可将仿真速度提升100倍,利用物理信息模型实时预测汽车、飞机等产品性能。公司推出针对特定行业的预训练模型,包括与本田合作的汽车设计模型和与Otto航空合作的飞机开发模型。融资由西门子风投领投,将用于扩大研发团队和市场销售。
清华大学研究团队通过MotionBench发现,当前最先进的AI视频理解模型在精细动作理解方面存在严重不足,准确率不足60%。他们提出的通过编码器融合技术TE Fusion有效改进了这一问题。这项研究揭示了视频AI理解的基础能力缺陷,为该领域发展指明了新方向。
伦敦量子动态科技公司宣布交付业界首台采用传统半导体制造工艺的量子计算机。该系统已安装在英国国家量子计算中心,使用标准化300毫米硅晶圆,是首台自旋量子比特计算机。系统采用CMOS技术,占地约三个19英寸服务器机架,具备数据中心友好特性。公司开发的可扩展瓦片架构支持大规模生产,未来可扩展至每个量子处理单元数百万量子比特,为商业化应用奠定基础。
上海人工智能实验室联合多家机构推出OVO-Bench评测体系,首次系统评估视频AI的在线理解能力。研究发现当前最先进的模型如GPT-4o在实时视频理解任务中表现远不如人类,缺乏时间感知、实时记忆和主动响应能力。该研究为智能家居、在线教育、医疗监护等实际应用场景的AI升级指明方向。