李开复旗下 AI 公司零一万物也宣布开源了其 Yi-9B 模型,官方称它是当前 Yi 系列模型中的“理科状元”——代码和数学能力表现最佳;不偏科,中文能力也很强。其全部参数量为 8.8B,有效参数8.31B,默认上下文长度为 4K tokens。Yi-9B(BF 16)在消费级显卡上轻松部署,使用成本较低,开发者友好。
除此之外,早先,包括阿里云对外开源了通义千问7B大模型,Meta开源了大模型Llama 2,谷歌开源大模型Gemma 7B,巨头已经纷纷开源,来加速端侧AI 落地。
“有意见”留言板
@本土化:中国的大模型公司应该更加注重模型的中文表现能力,毕竟主要服务中文人。中文语义的理解远比英文以及字母文字语言更加难理解。但 Yi 的模型评测里并没给出中文的测试评分,此外,从数据上看9B 好像没比别人的7B好多少。到底是不是套壳,开源后大家就好审查代码了。
@Betty:并不是开发,而是完全100% Meta的llama
好文章,需要你的鼓励
太空物联网连接服务商Myriota宣布其HyperPulse连接平台正式商用,该平台结合公司5G非地面网络架构与从Viasat租赁的L波段容量。该平台采用波束跳跃技术,根据流量需求激活所需波束,优化电池供电物联网设备功耗。相比UltraLite服务,HyperPulse提供更低延迟和更高日数据传输量。服务将于12月15日在美国、墨西哥、巴西、澳大利亚和沙特正式上线。
DeepSeek-AI团队开发的DeepSeekMath-V2突破了传统数学AI只关注答案正确性的局限,首次实现了AI的"自我验证"能力。该系统在2025年IMO竞赛中达到金牌水平,在2024年普特南竞赛中得分118/120,远超人类最高分。这项技术通过训练AI像数学专家一样检查和改进自己的推理过程,为AI辅助数学研究和教育开启了新的可能。
AMD与HPE宣布扩大合作,共同开发下一代开放式可扩展人工智能基础设施。HPE将成为首批采用AMD Helios机架规模AI架构的系统供应商,该架构整合了AMD EPYC处理器、Instinct GPU、Pensando网络技术和ROCm开源软件栈。Helios平台每机架可提供2.9 exaFLOPS的FP4性能,采用开放机架宽设计标准,旨在简化大规模AI集群部署。HPE计划2026年全球推出该解决方案。
这项由伊利诺伊大学与谷歌联合开展的研究提出了"分离然后合并"(StM)的视频合成新方法,通过自动分解5万个视频片段创建了大规模训练数据集,解决了传统方法无法同时保持原始动作和实现环境适应的问题,让AI能像经验丰富的演员一样既保持特色又融入新场景。