在刚举办的腾讯全球数字生态大会上,腾讯推出了超千亿参数规模、超2万亿tokens预训练语料,具有减少“胡言乱语”、能识别“陷阱”、可生成千字长文的腾讯自研通用大语言模型——腾讯混元大模型。其可以完成专业领域的多轮问答;支持文学创作、文本摘要、角色扮演;能够基于已有数据或信息进行推理、分析;同时有效解决事实性、时效性问题。
“有意见”留言板
@裂变:腾讯发布了基于超2万亿token的大模型,几乎同时,Technology Innovation Institute也开源了 3.5 万亿 token 训练的大模型,大家在训练 token 规模上基本处于同一量级,但腾讯更加认识到“AI必须应用到具体实践中,才能发挥最大价值”。人工智能正在成为下一轮数字化发展的关键动力、大模型基于产业场景,与企业数据融合,才能释放出最大的价值,已成为业界共识。相信在各个领域的技术突破将呈现出百花齐放的盛况。
@Betty:腾讯在全球数字生态大会上推出的混元大模型无疑是数字技术和AI领域的一个重要里程碑。这不仅彰显了腾讯在人工智能领域的技术实力,也预示着未来AI将在各行各业中扮演更加核心的角色。特别是在多个核心业务中的成功接入,足以说明该技术的实用性和可靠性。
@bic:腾讯云通过大模型深入产业全链条,推动产业智能化落地,这无疑将为各行各业带来巨大的变革和机遇。无论是在研发智能、生产智能、营销智能、服务智能还是管理智能等方面,腾讯云都展现出了强大的实力和广阔的前景。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。