近日,国内首个官方“大模型标准符合性评测”结果公布,首批通过评测的大模型有360智脑、百度文心一言、腾讯混元、阿里云通义千问。据了解,该测试由工信部中国电子技术标准化研究院发起,围绕大模型的通用性、智能性、安全性等维度开展,涵盖语言、语音、视觉等多模态领域,旨在建立大模型标准符合性名录,促进国内大模型和人工智能产业健康发展。
“有意见”留言板
@辣腿堡不加酱:希望这次的成功测试能加速它们在各种商业场景中的应用,如智能客服、内容推荐、自动翻译、语音识别等,进一步推动数字化转型。话说科大讯飞没参加测试么?
@媒体搬运工:业界“苦”大模型标准的缺失久矣,国标的出台希望能规范市场秩序,让那些浑水摸鱼者现出原形。
@Ada:大模型发展需要统一的权威评测体系,定性和定量相结合,工具和人类专家相结合来评测。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。