近日中国电信发布信息通信领域首个网络大模型——启明。“启明”网络大模型,依托于中国电信丰富的业务场景需求和海量网络数据/知识优势,贯通网络大模型语料准备、预训练、全参精调、反馈优化、推理部署的全流程。“启明”网络大模型对推动云网运营效率提升、云网能力开放及注智赋能千行百业具有重要意义。
“有意见”留言板
@Betty:中国电信发布的网络大模型“启明”在信息通信领域具有重要意义,将提升云网运营效率和支持各行各业的智能化发展。夏冰副总经理的思考为该技术的发展提供了明确方向,这一举措将助力中国经济社会的数字化转型,推动科技革命的进展。
@普惠:网络运维是数据中心的一大难题,智能驾驶网络提了很多年,网络大模型的加入希望能真正解决网络的各种问题,而不仅仅是一个概念的升级。如何大模型能否泛化赋能更多的数据中心也值得大家期待。
@bic:不管怎么说也是行业大模型的先驱了,期待能有更广泛的应用,而且发布会也提到了行业大模型没有gpt那种大量的计算,那么或许在算力这一层带动的不仅仅是GPU了。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。