近日,阿里云宣布开源了两款大模型——QWen-7B和QWen-7b-Chat,两款模型属于阿里云通义千问大模型系列,参数规模为70亿。目前已经在Hugging Face和ModelScope平台上开放,均免费、可商用。阿里云在今年4月推出通义千问大模型,如今过去了4个月,国内已是“百模混战”的局面,这个时候阿里云选择了开源的路线。继7月Meta发布开源Llama 2之后,阿里云成为国内首个加入大模型开源行列的科技大厂。
“有意见”留言板
@Futon:也许正说明现在光做大模型已经不够了,开源模型可以更好地利用各种资源,而且还可能帮助阿里云,获得更好的效益。让更多的人参与到模型的开发和使用中来,促进技术进步和普及,同时可以获得更多的贡献和回报,一石三鸟。
@老董:大模型已经看到的太多了,可是现在用起来的还没有看到多少,大模型能不能用,好不好用,在心里还是一个问号,希望今后可以看到更多大模型应用的实例,而不是简单的去“跑跑分”。
@鹅鹅鹅:从阿里云的这个操作来看,可能这个AI模型市场并不赚钱、应用AIGC也是赚钱能力有限。索性不如直接卖算力,吸引更多中小企业用户。
好文章,需要你的鼓励
如果美国有一家公司可以称得上是AI落地标杆,那么很多人大概率会提及Palantir。
南京大学LINK团队发布OmniVideoBench,这是首个专门评估AI音视频协同理解能力的测试基准。研究基于628个真实视频设计了1000道测试题,要求AI必须综合音频和视频信息才能回答。测试结果显示,即使最先进的Gemini-2.5-Pro准确率也仅58.90%,未达及格线,特别是在背景音乐理解方面表现最差,揭示了当前AI在复杂多模态推理方面的显著局限。
网络流量保护专家Cloudflare因其Access零信任平台发生故障向客户道歉,该故障导致包括OpenAI的ChatGPT、DownDetector和社交媒体平台X在内的多个面向公众的服务中断。故障始于英国时间上午11点20分左右,最初被描述为"内部服务降级"。Cloudflare后续确认故障根本原因是自动生成的配置文件超出预期大小并触发软件系统崩溃,强调这并非攻击所致。
中科大和上海创新院团队开发出RLFR技术,通过分析AI内部"思维流动"来优化推理训练。该技术不只看答案对错,而是评估整个推理过程质量,就像监控河流流向一样引导AI形成连贯逻辑。在数学推理等测试中显示显著提升,让AI推理过程更稳定可靠。这项开源技术为构建更智能可信的AI系统提供了新路径。