在近期举办的外滩大会上,蚂蚁集团宣布发布基于蚂蚁基础大模型,针对金融产业深度定制的金融大模型。大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。
“有意见”留言板
@媒体搬运工:金融业是数据密集型行业,而且数字化程度高,对于大模型而言是非常好的落地场景。不过金融也是高监管行业,合规性要求高。在金融业要想玩转大模型,有点走钢丝的味道。因为蚂蚁集团是面向中小微企业,所以其将大模型应用在供应链金融和零售金融这块的想象空间还是很大的。
@辣腿堡不加酱:就跟华为自研芯片一样,蚂蚁大模型走纯自研的技术路线,已建成的万卡AI集群,训练效率领先行业,为大模型产业化应用提供有力支撑,期待着蚂蚁未来的探索和精进。
@老董:从云计算一路走来,阿里一直站在数字化的前沿,这次蚂蚁金融大模型的推出,期望可以为金融行业的人工智能应用提供一个新的典范,也希望阿里的这只“蚂蚁”可以在人工智能的大路上走得越来越远。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。