李开复旗下 AI 公司零一万物也宣布开源了其 Yi-9B 模型,官方称它是当前 Yi 系列模型中的“理科状元”——代码和数学能力表现最佳;不偏科,中文能力也很强。其全部参数量为 8.8B,有效参数8.31B,默认上下文长度为 4K tokens。Yi-9B(BF 16)在消费级显卡上轻松部署,使用成本较低,开发者友好。
除此之外,早先,包括阿里云对外开源了通义千问7B大模型,Meta开源了大模型Llama 2,谷歌开源大模型Gemma 7B,巨头已经纷纷开源,来加速端侧AI 落地。
“有意见”留言板
@本土化:中国的大模型公司应该更加注重模型的中文表现能力,毕竟主要服务中文人。中文语义的理解远比英文以及字母文字语言更加难理解。但 Yi 的模型评测里并没给出中文的测试评分,此外,从数据上看9B 好像没比别人的7B好多少。到底是不是套壳,开源后大家就好审查代码了。
@Betty:并不是开发,而是完全100% Meta的llama
好文章,需要你的鼓励
苹果为多个Magic Keyboard型号发布固件更新,涵盖M4和M5 iPad Pro的11英寸和13英寸版本,以及为M3 iPad Air设计的11和13英寸Magic Keyboard。虽然这类更新不常见,但通常包含重要的漏洞修复、安全更新以及可靠性和性能改进。目前苹果尚未公布详细更新说明。用户可通过设置查看当前固件版本。
德国MPI信息学院等机构联合研究发现,当前先进的大型视觉语言模型在处理多张图片时存在严重局限:无法有效整合跨图片信息、难以同时追踪多个概念、易被干扰图片影响。研究团队通过MIMIC测试平台系统分析了这些问题,并提出数据驱动和注意力掩蔽两种解决方案,显著提升了AI的多图像理解能力,为未来多模态AI系统发展提供重要技术路径。
马斯克表示特斯拉将重启此前放弃的第三代AI芯片Dojo3项目,但这次不是用于地面自动驾驶模型训练,而是专门用于"太空AI计算"。五个月前特斯拉曾关闭Dojo项目并解散团队。马斯克称重启决定基于内部AI5芯片设计进展良好。他计划利用SpaceX的星舰发射计算卫星群,在太空中24小时利用太阳能运行AI数据中心,认为这是未来发展方向。
复旦大学团队构建的ABC-Bench是首个专门评估AI代码智能体完整后端开发能力的基准测试。该基准包含224个来自真实项目的任务,涵盖8种编程语言和19种框架,要求AI完成从仓库探索到服务部署的全流程开发。测试结果显示,即使最先进的Claude Sonnet 4.5模型通过率也仅63.2%,环境配置成为主要瓶颈,揭示了AI代码助手与实际工程需求间的显著差距。