3月25日,人民日报一篇《人工智能产业化应用加速》的文章令华为云旗下的盘古大模型再次引起关注。文中称,利用华为云盘古药物分子大模型,某先导药的研发周期从数年缩短至1个月,研发成本降低70%。该模型是“盘古大模型家族”的成员之一,目前华为云官网上,该系列AI大模型中的NLP大模型、CV大模型、科学计算大模型已经标记为即将上线状态。看起来,ChatGPT、文心一言相继发布后,沉寂两年的盘古大模型终于有动作了。
“有意见”留言板
@Ada:人民日报讲到AI产业化进程加快,华为云官网上也晒出了多个盘古大模型的产业化应用案例,除了语义理解、回答问题,盘古大模型的涵盖范围更广,产业化应用趋势更强。通过模型泛化,可以实现一个AI大模型在众多场景通用,减少对数据标注的依赖,让AI开发由作坊式转向工业化开发的新模式。
@媒体搬运工:在GPT上,我们成了追随者。为什么?太过于短期利益了。看看大家对于文心一言的评价,有点怒其不争的意味。我也很奇怪为啥在这次GPT的热潮中,华为鲜有发声。这次看到盘古的消息,希望不要令人失望。人家建平台,我们搞应用,终究在话语权上会很弱。所以,我们想要在下一个产业变革中占据有利地形,狠抓基础研究才是王道。
@辣腿堡不加酱:沉寂两年后,终于要上线了。最强国产版ChatGPT应用这个表述真是太吸引眼球了。盘古NLP大模型仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,超期待。
好文章,需要你的鼓励
从浙江安吉的桌椅,到广东佛山的沙发床垫、河南洛阳的钢制家具,再到福建福州的竹藤制品,中国各大高度专业化的家具产业带,都在不约而同地探索各自的数字化出海路径。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。