谷歌发布了开放模型Gemma。Gemma在拉丁语中意为“宝石”。 目前发布了分布具备20亿、70亿两种参数规模的模型:Gemma 2B 和 Gemma 7B。该模型主打轻量级、高性能,可以直接在开发者的笔记本电脑或台式机上运行。
据了解,Gemma 模型与谷歌规模最大、能力最强的 AI 模型 Gemini 共享技术和基础架构。在关键基准测试集上展现出同等规模最先进的性能。
“有意见”留言板
@反向超越:从大力出奇迹到低资源AI,谷歌Gemma又出了一记漂亮的重拳。不论在性能、能力甚至在资源使用量上都成为优秀的模型系列。然而Gemma只是开放不是开源,意味着国内套壳的可能性基本没了。科技差距仍需大家努力追赶。
@Betty:国内各种 AI 模型又要升级了吗
好文章,需要你的鼓励
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。