一直以来人们都有一个梦想,即借助人工智能AI技术来拓展现有人类智慧、知识和创造力的边界,但人脑复杂结构带来的学习能力远超人类构建AI的能力,于是AI只能通过各种特定深度学习模型来单点突破某些特定领域。而AIGC,即基于AI能力的内容创作(包括文字、图片和视频等等)也是其中一个重要类别。
然而AI的“深度学习”训练并不是拥有自我意识的自主学习,是通过收集大量样本让AI从海量数据中总结规律,再根据人类的指令,基于规律进行内容再生产的过程,它同时受核心算法、硬件条件、数据库样本等多方面的限制。但是在今年年初,AIGC的缺点被最终被 diffusion 扩散化模型克服,带来了魔术般的用户体验:打开网址,输入你想要画面的关键字,等待几分钟,模型就会生成完成度非常高的图片作品。普通人使用最尖端AI技术的门槛因此被降到最低,上线以来,仅通过官方平台 DreamStudio 制作的生成图片就超过1.7万亿张。
我们的科技留言板“有意见”如下:
@随机即灵感:AI作画的在技术的帮助下让人类不断提升对不确定性的认知。8年前,通过“生成式对抗网络”(GAN, Generative Adversarial Networks)的AI画作只不过是通过自鉴别进行不断地逼近模仿。今天的稳定扩散模型(Stable Diffusion Model)通过引入不可观测的随机变量,让画作更”自然“,也体现出了不确定性的魅力所在。
@bicmao:并不认同“AI取代人类”这句话。Diffusion大火之前,AI绘图其实比较一般,大部分AI绘图基本只能生成特定类型的图片,Diffusion确实使得AI绘图有了质量上的飞跃,而且可以很好地根据语言指导生成,但是可控性依然不足,功能指向性也较单一。目前,AI绘图尚不成熟。比如“五彩斑斓的黑”这种需求,对于怼也怼不了,做也做不出的AI来说,就只能化身“Siri”了。
@素颜也倾城:“关键词、数据库、模糊查找、潜在扩散模型”=“素材库融合怪”,Stability AI是否可以“唤醒人类的潜能”我不清楚,但是目前AI还没有独立的思考及创造能力,摆在我们眼前的还是如何防范AI创作模型的“剽窃”。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。