前一阵,华为云官网刚上线了盘古系列AI大模型的最新消息,近日,在人工智能大模型技术高峰论坛上,华为云AI领域首席科学家、国际欧亚科学院院士田奇首次介绍了盘古大模型的进展及其应用。论坛上,田奇重点提到AI for Industries和AI for Science,不过对广受关注的类GPT模型——盘古NLP大模型仅用一句话带过其应用进展。总体来看,此次介绍的内容并不新颖,不少网友对没有演示表示不满。
“有意见”留言板
@媒体搬运工:B端的AI应用不像C端那么有存在感,但是重要性不言而喻,华为的盘古是更多是面向领域的大模型,这样可以深入行业场景,其价值不容小觑,相比ChatGPT那样的泛化大模型,我看好盘古这样的垂直行业大模型。
@吃葡萄不吐葡萄皮:作为AI语言模型的领先者之一,华为的盘古大模型确实可以为传统AI开发带来更多的便利和效率,提供更加高效的自然语言处理能力,让开发者可以更快地完成AI应用的开发和部署。这需要开发者具有一定的技术储备和领域经验,才能更好地利用盘古大模型来解决实际问题。
@取个啥名字:目前这波大模型的聊天机器人是基于语言的,盘古行业的大模型看起来主要基于CV。从国内摄像头密度来看,我们的视觉数据丰度必然是高于全球的,希望能走出一个换道超车的路来。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。