芯片是大模型背后的算力之源。凭借10000片英伟达GPU芯片,OpenAI训练出了GPT-3大语言模型,英伟达的GPU也成为大模型训练的首选。而与英伟达并称为显卡双雄的AMD,在这波AI浪潮中自然也不甘落后。今年下半年,AMD将推出对标英伟达GH200超芯的MI300,发力AI训练市场。MI300是市面上首款“CPU+GPU+内存”一体化产品,也是AMD投入生产最大的芯片,晶体管数量达到1460亿个。
“有意见”留言板
@媒体搬运工:在大模型这波热炒中,芯片居然成了最大赢家。俗话说,羊毛出在猪身上。当AI烧钱到这个程度,那谁会买单呢?就像某个广告词所说的,我们不生产算力,而只是算力的搬运工。算力的狂欢,谁是最后的接盘侠呢?!
@Ada:最近《福布斯》刚为AMD CEO苏姿丰发表了特刊,称苏妈一手策划了硅谷历史上最重大的企业转型之一,使得一度濒临破产的AMD股价在不到十年里增长了近30倍。杂志还提到黄仁勋是苏姿丰的远房亲戚,那么这次面对AI浪潮,同为华裔芯片老总的她,能将AI王冠从这位“远亲”的头上摘下来吗?
@无糖冰可乐:AMD在GPU市场取得成功的潜力很大,并且在研发方面投资加大有利于公司在竞争中占得先机。英伟达等竞争对手也在不断进步,因此双方之间的竞争必定会持续激烈。不管结果如何,消费者最终将受益于市场竞争所带来的更高性能、更创新的产品。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。