双十一刚过完一天,阿里云就发生全线崩溃的重大事故。据阿里云公告,受影响产品包括:网络、计算、存储以及各类云计算应用服务。受影响地域涵盖了我国国内的华东、华北、华南、西南、等地区,以及海外等多个国家。阿里云发布公告称,监控发现云产品控制台访问及API调用出现异常,阿里云工程师正在紧急介入排查。目前,绝大部分地域控制台服务已恢复访问。
“有意见”留言板
@媒体搬运工:谁说分布式比单体式软件构架更安全?分布式架构和云原生让软件组件之间的依赖关系更加复杂,故障排除的难度也陡增,对于阿里这样的大厂也许可以在事发后迅速解决问题,但是对于普通企业来说那可是灾难了。
@辣腿堡不加酱:看到阿里云这次的翻车真是心里咯噔一下,之前说的可用区、容灾能力不知是否能让阿里云安全恢复。企鹅和遥遥领先是否也会存在一些风险?
@老董:想当前双十一的其中一个目的就是为了对云计算应用可靠性进行检验,也正是一次次经受住双十一流量洪峰的考验,云计算才受到了充分的认可。然而如今不需要再用双十一的做法来对云进行考验了,而阿里云反而撑不住了,希望这个事情最终会有一个合理的解释出来吧。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。