今年世界人工智能大会,大模型和生成式AI是重头戏。大会首次设置了“迈向通用人工智能”主题展区,集中展示国内外30多款大模型,百度文心、阿里通义、华为盘古、讯飞星火、商汤日日新等大模型悉数登场。仅过去两个月内,星环科技、科大讯飞、火山引擎、小i机器人等多家公司都发布了大模型的进展,目前中国10亿以上参数规模的大模型已经接近80个。
“有意见”留言板
@老董:大模型是“群魔乱舞”还是“百家争鸣”,最后还要看实际的应用效果。当前大模型可以为用户提供出强大的数据整理归纳能力,但如何使用好这种能力获得企业及用户的认同,还需要经过一段时间的摸索。百花齐放后将会是大浪淘沙,只有经过实践的检验,是金子总是会发出光来。
@Futon:行业大模型是一个有前景的方向,不过30多个大模型也太能卷了!希望这里面没有套壳的,也期待有一天能看到中国的OpenAI是什么样子。
@独木舟:大模型的可解释性和透明度不足,可能会导致一些潜在的风险。比如说模型可能会学习到有偏见的信息,或者在一些重要的决策场景中做出错误判断。如果是我一点不了解的事情,我是不敢完全依赖模型的。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。