一直以来人们都有一个梦想,即借助人工智能AI技术来拓展现有人类智慧、知识和创造力的边界,但人脑复杂结构带来的学习能力远超人类构建AI的能力,于是AI只能通过各种特定深度学习模型来单点突破某些特定领域。而AIGC,即基于AI能力的内容创作(包括文字、图片和视频等等)也是其中一个重要类别。
然而AI的“深度学习”训练并不是拥有自我意识的自主学习,是通过收集大量样本让AI从海量数据中总结规律,再根据人类的指令,基于规律进行内容再生产的过程,它同时受核心算法、硬件条件、数据库样本等多方面的限制。但是在今年年初,AIGC的缺点被最终被 diffusion 扩散化模型克服,带来了魔术般的用户体验:打开网址,输入你想要画面的关键字,等待几分钟,模型就会生成完成度非常高的图片作品。普通人使用最尖端AI技术的门槛因此被降到最低,上线以来,仅通过官方平台 DreamStudio 制作的生成图片就超过1.7万亿张。
我们的科技留言板“有意见”如下:
@随机即灵感:AI作画的在技术的帮助下让人类不断提升对不确定性的认知。8年前,通过“生成式对抗网络”(GAN, Generative Adversarial Networks)的AI画作只不过是通过自鉴别进行不断地逼近模仿。今天的稳定扩散模型(Stable Diffusion Model)通过引入不可观测的随机变量,让画作更”自然“,也体现出了不确定性的魅力所在。
@bicmao:并不认同“AI取代人类”这句话。Diffusion大火之前,AI绘图其实比较一般,大部分AI绘图基本只能生成特定类型的图片,Diffusion确实使得AI绘图有了质量上的飞跃,而且可以很好地根据语言指导生成,但是可控性依然不足,功能指向性也较单一。目前,AI绘图尚不成熟。比如“五彩斑斓的黑”这种需求,对于怼也怼不了,做也做不出的AI来说,就只能化身“Siri”了。
@素颜也倾城:“关键词、数据库、模糊查找、潜在扩散模型”=“素材库融合怪”,Stability AI是否可以“唤醒人类的潜能”我不清楚,但是目前AI还没有独立的思考及创造能力,摆在我们眼前的还是如何防范AI创作模型的“剽窃”。
好文章,需要你的鼓励
随着AI基础设施快速扩张,水资源正成为继电力之后的另一重大制约因素。高密度GPU集群产生大量热能,需要大规模冷却水支撑,部分数据中心单日用水需求高达数百万加仑。多地水务部门已明确表示现有供水能力无法满足需求。研究预测,到2030年美国数据中心新增日用水需求可能高达14.5亿加仑。水资源短缺、废水处理压力及峰值用水波动,正深刻影响AI数据中心的选址与建设规划。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
CoreWeave发布新平台,支持企业部署可自主学习和优化的AI智能体。该平台通过无服务器强化学习机制,让大语言模型在真实业务环境中持续微调,无需企业自建基础设施。相比传统方式,该方案可降低超40%成本,训练速度提升约1.4倍,且不影响质量。据麦肯锡2025年AI现状报告,约62%的受访企业正在试验AI智能体,生产部署趋势日益明显。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。