国内大厂里第一个“类ChatGPT”产品发布了。今天下午两点,百度在北京召开新闻发布会,正式推出百度新一代大语言模型文心一言。发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。今天起,首批用户即可通过邀请测试码,在文心一言官网体验产品,百度智能云还将面向企业客户开放文心一言API接口调用服务。
“有意见”留言板
@文文文文你的心:“漫不经心的一言”几乎同步GPT-4发布,就性能而言,或许是迅速调用了AI绘画、视频生成的接口的产物。“精工出细活”不是没有道理,短期赶工不被买账是必然的,股价已经说明了一切。还是希望百度踏踏实实做产品,短期“圈”快钱这种事,大家都看在眼里。
@升维才能超越:科技果然不是一蹴而就。文新一言的发布正如大家所担忧的那样——尚存在不小的差距。资本也用脚做出了投票,文新一言发布会结束时百度股价跌去近10%。我国科技不能只靠封闭市场给企业留生存空间,而是要从基础研究就重视科技积累、从商业模式尊重客户需求,只挣快钱、靠模仿、抄袭,不研究客户真实需求,依葫芦画瓢只能跟随永远做不到超越。
@隔壁二大爷:在OpenAI发布GPT4.0后,“百度文心一言新闻发布会”马上召开了,李彦宏讲:从我个人的试用和体验的角度来说,它不能叫做“完美”,但为什么要今天发布,因为市场需求这个产品。试问科技大佬为抢占市场而发布产品,是否也应该为产品背后的漏洞买单?
好文章,需要你的鼓励
从浙江安吉的桌椅,到广东佛山的沙发床垫、河南洛阳的钢制家具,再到福建福州的竹藤制品,中国各大高度专业化的家具产业带,都在不约而同地探索各自的数字化出海路径。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。