国内大厂里第一个“类ChatGPT”产品发布了。今天下午两点,百度在北京召开新闻发布会,正式推出百度新一代大语言模型文心一言。发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。今天起,首批用户即可通过邀请测试码,在文心一言官网体验产品,百度智能云还将面向企业客户开放文心一言API接口调用服务。
“有意见”留言板
@文文文文你的心:“漫不经心的一言”几乎同步GPT-4发布,就性能而言,或许是迅速调用了AI绘画、视频生成的接口的产物。“精工出细活”不是没有道理,短期赶工不被买账是必然的,股价已经说明了一切。还是希望百度踏踏实实做产品,短期“圈”快钱这种事,大家都看在眼里。
@升维才能超越:科技果然不是一蹴而就。文新一言的发布正如大家所担忧的那样——尚存在不小的差距。资本也用脚做出了投票,文新一言发布会结束时百度股价跌去近10%。我国科技不能只靠封闭市场给企业留生存空间,而是要从基础研究就重视科技积累、从商业模式尊重客户需求,只挣快钱、靠模仿、抄袭,不研究客户真实需求,依葫芦画瓢只能跟随永远做不到超越。
@隔壁二大爷:在OpenAI发布GPT4.0后,“百度文心一言新闻发布会”马上召开了,李彦宏讲:从我个人的试用和体验的角度来说,它不能叫做“完美”,但为什么要今天发布,因为市场需求这个产品。试问科技大佬为抢占市场而发布产品,是否也应该为产品背后的漏洞买单?
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
字节跳动团队开发了首个AI研究助手评估系统ReportBench,通过对比AI生成报告与专家综述论文的引用质量,并验证陈述准确性来评估AI助手表现。研究发现OpenAI Deep Research引用准确率38.5%,Gemini为14.5%,两者都存在陈述和引用幻觉问题。该系统为AI研究助手建立了标准化质量检测工具,推动行业发展。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
台湾大学研究团队开发了MovieCORE数据集,这是首个专门训练AI深度理解电影内容的创新工具。该数据集通过多AI智能体协作生成复杂问题,采用认知分类法测量思维深度,99.2%的问答需要高层次思维。研究还开发了ACE增强技术,可将AI性能提升25%。实验显示现有AI在深度视频理解方面仍存在显著不足,为未来AI发展指明了方向。