今天,C-Eval大模型评测榜单更新,vivo自研大模型在C-Eval全球中文榜单中位列第一。此前,该大模型已经取得了CMMLU全球中文榜单第一。据了解,vivo将在11月1日举办的vivo开发者大会(2023 VDC)中发布全新手机操作系统OriginOS 4。vivo相关负责人透露,vivo自研AI大模型将会在OriginOS 4系统中被首次应用,其中包括十亿、百亿、千亿三个不同参数量级的5款自研大模型,全面覆盖核心应用场景。
“有意见”留言板
@媒体搬运工:手机端的大模型应用场景更多,空间也大。想想动动嘴就可以完成的操作,而不是用手指不断敲击屏幕,这才是我想要的智能手机。
@Ada:自研才能有差异化,这次又是自研AI大模型,又是OriginOS 4和自研操作系统,蓝厂是不是提速了,下个月的开发者大会关注一波。
@辣腿堡不加酱:vivo要在全新的手机操作系统OriginOS 4 首发vivo自研A大模型,真是将对大模型的探索从技术研发阶段进阶至应用及产业布局阶段,期待着AI大模型落地后带给我们的全新功能体验。
好文章,需要你的鼓励
微软与三星达成合作,将Copilot人工智能助手集成到三星的智能电视和显示器产品中。用户可以通过语音或遥控器直接与Copilot交互,获得智能问答、内容推荐、设备控制等服务。这一合作标志着AI助手从传统计算设备向家庭娱乐设备的进一步扩展,为用户提供更加智能化的观看体验。
华盛顿大学研究团队通过创新的内部分析方法,深入探索了大语言模型的推理机制。研究发现模型确实具备多步推理能力,但存在脆弱性和一致性问题。当推理出错时错误会传播,且对相似问题可能给出不同答案。研究揭示了模型内部的专门化功能模块和注意力分配机制,为开发更可靠的AI系统提供了重要指导。
在全球经济不确定性增加的背景下,AI创新竞赛正在加速进行。但许多企业仍缺乏执行工具:Gartner预测到2027年,60%的组织将因数据治理问题而无法实现AI用例的价值。企业需要统一的数据平台支持所有数据模型,建立可靠的AI就绪数据管道,并通过主权AI工厂标准化AI流水线。通过集成向量数据库、嵌入管道和模型服务,企业可将生产就绪应用的部署时间从数月缩短至数小时,实现完整的数据主权和治理。
ByteDance推出AetherCode基准测试,采用IOI、ICPC等顶级编程竞赛真题,并由67名专家设计高质量测试用例。结果显示最先进AI模型通过率仅35.5%,极难题目仅3.8%,揭示AI编程能力被严重高估。该研究为AI评估树立新标准,表明AI在复杂逻辑推理方面仍远落后人类,推理型模型优势明显,为未来AI发展提供重要指导。