大语言模型有个弱点是偏科,由于是基于语言文本训练的,它们更擅长文科,在解决数学问题方面显得力不从心。比如之前好几个大模型都没算明白鸡兔同笼。近日,学而思宣布正在自研数学大模型MathGPT,并将于年内推出基于该模型的产品级应用。学而思AI团队表示,MathGPT需要结合大语言模型和计算引擎两者的能力,大语言模型负责理解题目、分步解析,并在合适的步骤自行调用计算引擎。
“有意见”留言板
@不倒翁:打造一个能力超强的会教数学、做数学题的大模型是完全可能的。可惜现在缺少高斯、牛顿、华罗庚等数学天才。要是这些天才把自己的学习方法喂给AI,那AI的数学能力肯定超强的。目前AI唯一缺陷就是能耗太高。人脑消耗1瓦特做的算术题,AI可能需要10万瓦特。
@黑咕隆咚:学而思关于自研数学大模型的研发,还是比较有前瞻性的。数学在各个领域都发挥着举足轻重的作用,也许以后还能为数学教育和科研发展带来革命性的影响呢。
@周一见:从目前发布的应用来看,这一轮大模型的星星之火,率先在教育产业点燃。这对于个性化辅导、提高学习效率,或许会有非常大的价值,长期看,对于教育普惠也将带来更多想象空间。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。