一直以来人们都有一个梦想,即借助人工智能AI技术来拓展现有人类智慧、知识和创造力的边界,但人脑复杂结构带来的学习能力远超人类构建AI的能力,于是AI只能通过各种特定深度学习模型来单点突破某些特定领域。而AIGC,即基于AI能力的内容创作(包括文字、图片和视频等等)也是其中一个重要类别。
然而AI的“深度学习”训练并不是拥有自我意识的自主学习,是通过收集大量样本让AI从海量数据中总结规律,再根据人类的指令,基于规律进行内容再生产的过程,它同时受核心算法、硬件条件、数据库样本等多方面的限制。但是在今年年初,AIGC的缺点被最终被 diffusion 扩散化模型克服,带来了魔术般的用户体验:打开网址,输入你想要画面的关键字,等待几分钟,模型就会生成完成度非常高的图片作品。普通人使用最尖端AI技术的门槛因此被降到最低,上线以来,仅通过官方平台 DreamStudio 制作的生成图片就超过1.7万亿张。
我们的科技留言板“有意见”如下:
@随机即灵感:AI作画的在技术的帮助下让人类不断提升对不确定性的认知。8年前,通过“生成式对抗网络”(GAN, Generative Adversarial Networks)的AI画作只不过是通过自鉴别进行不断地逼近模仿。今天的稳定扩散模型(Stable Diffusion Model)通过引入不可观测的随机变量,让画作更”自然“,也体现出了不确定性的魅力所在。
@bicmao:并不认同“AI取代人类”这句话。Diffusion大火之前,AI绘图其实比较一般,大部分AI绘图基本只能生成特定类型的图片,Diffusion确实使得AI绘图有了质量上的飞跃,而且可以很好地根据语言指导生成,但是可控性依然不足,功能指向性也较单一。目前,AI绘图尚不成熟。比如“五彩斑斓的黑”这种需求,对于怼也怼不了,做也做不出的AI来说,就只能化身“Siri”了。
@素颜也倾城:“关键词、数据库、模糊查找、潜在扩散模型”=“素材库融合怪”,Stability AI是否可以“唤醒人类的潜能”我不清楚,但是目前AI还没有独立的思考及创造能力,摆在我们眼前的还是如何防范AI创作模型的“剽窃”。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。