近日,国内首个官方“大模型标准符合性评测”结果公布,首批通过评测的大模型有360智脑、百度文心一言、腾讯混元、阿里云通义千问。据了解,该测试由工信部中国电子技术标准化研究院发起,围绕大模型的通用性、智能性、安全性等维度开展,涵盖语言、语音、视觉等多模态领域,旨在建立大模型标准符合性名录,促进国内大模型和人工智能产业健康发展。
“有意见”留言板
@辣腿堡不加酱:希望这次的成功测试能加速它们在各种商业场景中的应用,如智能客服、内容推荐、自动翻译、语音识别等,进一步推动数字化转型。话说科大讯飞没参加测试么?
@媒体搬运工:业界“苦”大模型标准的缺失久矣,国标的出台希望能规范市场秩序,让那些浑水摸鱼者现出原形。
@Ada:大模型发展需要统一的权威评测体系,定性和定量相结合,工具和人类专家相结合来评测。
好文章,需要你的鼓励
B&H近期对多款M5 Pro MacBook Pro机型推出300美元优惠。14英寸M5 Pro版本(48GB内存+1TB固态硬盘)现售价2299美元,较原价2599美元节省300美元,且该配置在亚马逊无法购买,折扣机会更为难得。此外,16英寸M5 Pro版本(64GB内存+1TB固态硬盘)同样享有300美元折扣。B&H在多款高配MacBook机型上的定价已低于亚马逊,是近期可找到的最优价格。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
Insta360推出GO 3S复古套装,将现代4K运动相机与胶片时代美学结合。套装核心仍是仅重39克的GO 3S,新增复古取景器、胶片风格滤镜、NFC定制外壳及可延长录制时长至76分钟的电池组。复古取景器模仿老式腰平相机设计,鼓励用户放慢节奏、专注构图。相机内置11种色彩预设及负片、正片等滤镜,同时保留FlowState防抖、4K拍摄及10米防水能力,面向热衷复古影像风格的年轻创作者。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。