上周四,谷歌在YouTube官方账号发布了一个Gemini的交互演示视频,引发了大量网友的关注和讨论,然而热度和夸赞还没享受多久,谷歌转眼就陷入了造假风波。视频中看起来Gemini能够快速识别图像,并通过自己的理解直接做出反应。但实际上,这段演示视频并不是实时的,而是通过读取图片,再编写提示词,才让Gemini做出的回应。事后谷歌已经证实,视频确有剪辑。
“有意见”留言板
Ada:Gemini的“原生多模态”,区别于现有的“拼凑多模态”模型,即从一开始就使用多种模态(例如音频、视频和图像)训练而成。因此,Gemini可能会带来一些突破,但不要先把信任搞没了,毕竟谷歌在制作演示视频这方面有前科。
@辣腿堡不加酱:虽说谷歌视频演示的多模态能力,可能在一年内就能实现。但宣传过火,以至于让公众认为视频造假,不知是不是单纯为了博眼球,赚流量,但给公众的感受还是不太好的。
@媒体搬运工:大模型也玩大跃进?大家都不能免俗,踏实研究别浮躁,人工智能时代要务实一些!
好文章,需要你的鼓励
Roig Arena 将于 2025 年 9 月在瓦伦西亚开业,借助 Extreme Networks 的 6GHz Wi-Fi 与数据分析技术,实现无缝运营与个性化观众体验,打造全天候活动中心。
这项研究首次系统研究了大语言模型在表达不确定性时的"忠实度"问题,发现它们往往在不确定时仍使用肯定语言,导致用户过度信任。研究团队提出了MetaFaith方法,通过激发模型的"元认知"能力,使其能更诚实地表达不确定性。在14种模型和10个数据集的测试中,MetaFaith将忠实度提升了高达61%,且83%的情况下被人类评为更可靠。这一突破对构建更值得信任的AI系统具有重要意义。
OpenMamba 是一款意大利独立滚动更新的 Linux 发行版,基于 Fedora 工具构建,提供 KDE Plasma 与 LXQt 桌面。它采用最新组件和标准打包工具,运行稳定且易用,适合规避主流系统限制的用户。
这项研究提出了强化蒸馏(REDI)框架,创新性地利用大型语言模型生成的正确和错误推理过程进行训练。传统方法仅使用正确样本,浪费了包含宝贵信息的错误样本。REDI采用两阶段方法:先用正确样本建立基础,再通过非对称加权的目标函数利用错误样本进一步优化。实验表明,仅用131k个公开数据样本训练的Qwen-REDI-1.5B模型在MATH-500等基准上达到83.1%准确率,与使用800k专有数据训练的同类模型相当或更优,为小型模型离线学习复杂推理能力提供了高效途径。