过去的2023年,千亿参数大模型成为百模大战的高级段位,但是需要的资金成本却不是每一个玩家可以承担的。
这不性价比更高的方案来了——猎户星空正式官宣了一款千亿级效果的百亿大模型。而且只要千元显卡即可运行!
猎户星空大模型(Orion-14B)是由猎户星空研发的预训练多语言大语言模型,以其140亿参数规模展现出了性能。
大模型浪潮中,做好应用依然是创业者最好的机会。为此,猎户星空推出大模型深度应用“聚言”,面向企业客户提供大模型咨询与服务一站式解决方案。
“有意见”留言板
@媒体搬运工: 模型不在大,够用就行。但是如何定义够用也是个问题,只能说今年业界的重点不在造大模型,而是用大模型。
@ABC:进入2024年,大模型市场又会如何发展呢?拼参数?拼应用?希望今年大模型能出现令人眼前一亮的东西。
好文章,需要你的鼓励
刚刚,确实是刚刚。2026 年 6 月 12 日,SpaceX 以每股 135 美元在纳斯达克挂牌(SPCX),收于 160.95 美元,涨 19%,市值突破 2 万亿美元,史上最大 IPO。
这项研究提出用费舍尔信息矩阵谱范数衡量深度神经网络的内在脆弱性,无需发动对抗攻击即可评估模型稳健性,并推导了VGG、ResNet、DenseNet和Transformer的理论排名。
前美国总统候选人杨安泽认为,AI浪潮将压缩薪资、取代就业,由此催生出一个新的创业机会——帮助普通人降低生活成本。他以马克·库班的平价药品公司为灵感,于去年创办了移动虚拟运营商Noble Mobile,以低价提供手机服务并与用户共享利润。杨安泽表示,住房、教育、食品、交通等基本生活领域都存在巨大机会,市场可以在政策失灵时发挥再分配作用,鼓励创业者突破AI泡沫思维,关注真实的民生问题。
南加州大学提出DistIL方法,通过前向交叉熵目标和完整序列级梯度,解决AI自蒸馏训练中方向偏差与局部信用分配问题,在科学推理、编程和难题数学上均超越现有基线。