今天科大讯飞发布了星火认知大模型。据介绍,星火认知大模型支持多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型可解析数学能力、多功能多语言代码能力。还能智能播报生成内容,甚至直接生成虚拟人展示。科大讯飞董事长刘庆峰表示,星火认知大模型将在10月24日前,中文超越ChatGPT,英文接近。
“有意见”留言板
@TOFU:申请通过的速度还挺快的,可能真有信心吧。整体感觉确实也比文心强一些,而且响应速度很快,语音功能算是锦上添花,但想不到太好的使用场景。还有就是名字取得好,起码好记。还有一点可能是大模型目前的通病,答案容易重复,就算是编故事,让它一直“继续”下去,到最后也会变成车轱辘话的死循环。
@bicmao:科大讯飞一直处在国内人工智能第一梯队,但在国内大模型已呈“混战”状态的当下,尤其是部分互联网厂商布局更早且已经有了大量生态合作的背景下,讯飞星火的机会在哪?个人而言,机会是有的,一方面科大讯飞在Transformer深度神经网络算法方面拥有丰富经验,另一方面,提出的1+N战略也是场景化布局的一个思路。当然,只有产品达到刚需的要求,才能真正实现规模化推广。
@痛点:火星大模型与其他互联网或者IT企业做大模型的不同在于科大讯飞一直在深耕行业。在数据积累和行业认知上都有很大优势,可能是最有机会快速落地的大模型。AI能否快速落地在于企业对其的投入产出比,以及是否是能快速解决企业当前的业务难题,如果既有价格优势又能解决行业痛点将最易胜出。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。