著名大模型开源平台stability.ai推出了——Stable Diffusion 3,据官方介绍,其对prompt的理解以及在图像质量、拼写能力方面的AI生图效果达到全新高度。关键是其创新的模型组合是在消耗更少的算力下实现的。
该创新模型指的是Transformer和Flow FMatching(简称“FM”)的组合。Transformer让AI效果更好,而FM这是更加高效的一种建模、训练技术。这样用不了多久在移动设备上实现更好的AI生图开发成为可能。
这就是开源平台的优势,越来越多的天才注视下,大模型由虚化实正在加速。
“有意见”留言板
@PC瑟瑟发抖:开源阵营追得好快,演示效果看起来很棒,有条件当然值得升级,但怎么又是waitlist?!而且参数规模比SD 2.1大了不少,根据Emad的说法,恐怕对硬件要求也更高了吧,起码用消费级PC带它感觉有点悬啊。
@变天了:采用了sora的架构,是不是侧面证明,美国的AI届现在已经在图片和视频生成上达成共识,diffusion transformers就是当前的最优解呢
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。