11月30日,2022腾讯全球数字生态大会在深圳宝安举行,为期两天。腾讯云与智慧产业事业群(CSIG)与合作伙伴在会上分享了对数实融合、全真互联、Web 3.0等行业趋势的看法,共同探索云厂商的海外发展路径。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生强调,“全真互联”将会是腾讯未来发展的重要战略与路线图。汤道生表示,腾讯将立足“产品为王,场景为先”, 在关键产品赛道上,做行业数一数二的产品。另外据介绍,腾讯目前已与1万多家生态伙伴达成合作,合作伙伴收入占比达到1/3。
我们的科技留言板“有意见”如下
@四渡赤水:未来的竞争将是算力的竞争。多样化、跨体系处理器协同成为提升计算并行度和能效的重要手段,实现多样异构算力的统一管理调度,腾讯面临着来自英特尔、英伟达等企业的诸多挑战。而在数据中心,密集计算对云端计算体系架构提出了高要求,DPU以数据加速方式提升算力的优势明显。加速发展DPU将是短期内在无法绕过CPU、GPU卡脖子技术快速发展算力的重要途径。
@bicmao:本次“2022 腾讯全球数字生态大会”上汤道生着重强调了“精益制造是首要目标”。而精益制造或与国家提出”专精特新“战略相辅相成。在当前多品种、小批量、短周期的市场环境下,对产品进行市场细分并实施精益制造或是助力”专精特新“的一种聚焦战略”。而如何以相对较低的成本实现一定的数字化,逐步提高企业精益生产程度,则是“专精特新”中小企业普遍关心的问题。
@隔壁二大爷:站在云端的高手都是寂寞的,可能是担心技术泄露,高手说话喜欢藏一半,好像是什么都说了,又好像什么都没说,突出一种寂寞的感觉,大会看完我只记住了腾讯云异构这款产品有个产品总监,他的名字叫宋丹丹。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。