有意见 | 首批四家通过！国家大模型标准测试结果揭晓原创

首批通过评测的大模型有360智脑、百度文心一言、腾讯混元、阿里云通义千问。

近日，国内首个官方“大模型标准符合性评测”结果公布，首批通过评测的大模型有360智脑、百度文心一言、腾讯混元、阿里云通义千问。据了解，该测试由工信部中国电子技术标准化研究院发起，围绕大模型的通用性、智能性、安全性等维度开展，涵盖语言、语音、视觉等多模态领域，旨在建立大模型标准符合性名录，促进国内大模型和人工智能产业健康发展。

“有意见”留言板

@辣腿堡不加酱：希望这次的成功测试能加速它们在各种商业场景中的应用，如智能客服、内容推荐、自动翻译、语音识别等，进一步推动数字化转型。话说科大讯飞没参加测试么？

@媒体搬运工：业界“苦”大模型标准的缺失久矣，国标的出台希望能规范市场秩序，让那些浑水摸鱼者现出原形。

@Ada：大模型发展需要统一的权威评测体系，定性和定量相结合，工具和人类专家相结合来评测。

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

人工智能

硬件加速

企业级升级

2025-10-09

IBM大型机本月获得Spyre AI加速器升级

IBM Spyre加速器将于本月晚些时候正式推出，为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡，配备32个独立加速器核心，专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡，支持多模型AI处理，包括生成式AI和大语言模型，主要应用于金融交易欺诈检测等关键业务场景。

人工智能

许可证合规

自动化检测工具

2025-10-09

加拿大女王大学：开源AI生态系统中的“版权炸弹“即将引爆？

加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计，发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题，揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。

人工智能

废物管理

智能分拣系统

2025-10-09

Ganiga将在TechCrunch Disrupt展示AI垃圾分拣机器人

意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly，能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件，旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元，已向谷歌和多个机场销售超120台设备，计划融资300万美元并拓展美国市场。

语音识别

扩散大语言模型

并行处理优化

2025-10-09

语音识别遇上“扩散大脑“：剑桥-清华-伊利诺伊团队让机器听得更准确

这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域，开发出Whisper-LLaDA系统。该系统具备双向理解能力，能够同时考虑语音的前后文信息，在LibriSpeech数据集上实现了12.3%的错误率相对改进，同时在大多数配置下提供了更快的推理速度，为语音识别技术开辟了新的发展方向。

有意见 | 首批四家通过！国家大模型标准测试结果揭晓 原创

来源：至顶网有意见频道

2023

12/25

17:48

分享

点赞

API安全：守护智能边缘的未来

Solidigm 成立AI中央实验室，配备高性能、大密度存储测试集群

智慧城市的绿色引擎：从楼宇到数据中心的可持续之路

IBM大型机本月获得Spyre AI加速器升级

Ganiga将在TechCrunch Disrupt展示AI垃圾分拣机器人

新加坡昇菘集团获批自动驾驶车队运营供应链

思科新路由器将分散数据中心整合为AI训练集群

CoreWeave推出无服务器强化学习平台降低企业AI成本

当年只有30人在训练AGI：Anthropic预训练负责人访谈的万字实录，曾经的AI实验室都是通才，现在大家都是专才

NBA中国与阿里云宣布达成多年合作，重塑球迷互动体验

PEC 2025 AI创新者大会年度提问：新工作时代：AI工作流由谁主导？

PEC 2025 AI创新者大会年度对话：新创意时代，AI如何定义“第十艺术”？

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

蚂蚁数科提出创新跨域微调框架ScaleOT入选全球AI顶会AAAI 2025

国产软件再破记录！阿里云PolarDB数据库登顶TPC-C双榜第一

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | 首批四家通过！国家大模型标准测试结果揭晓原创