据说,名为 Groq 的初创公司带着史上最快的大模型和自研芯片LPU来了。经过网友测试,Groq每秒生成速度接近500 tok/s,碾压GPT-4的40 tok/s。
根据Groq官网的介绍,LPU是一种专为AI推理所设计的芯片。但要训练大模型,仍然需要购买GPU。如果把训练必做养兵千日,那么推理就是用兵一时,两者缺一不可。Groq LPU的快速输出,还是离不开背后GPU的数据训练。 因此结合训练和推理的总成本来看。如人工智能专家贾扬清分析称,Groq综合成本相当于英伟达GPU的30多倍。
“有意见”留言板
@卡卡卡卡西:面对大模型,船大不好掉头的反而是芯片厂商,大家都知道大模型更需要的是访存密集型芯片,但现在的芯片厂商都是基于自己干了那么多年的芯片架构进行优化,没勇气从头再来,所以OpenAI奥特曼才想自研芯片,这也才有了Groq的震撼登场。
@贰言:Groq的自研LPU比英伟达的GPU性能更强,这对英伟达等传统AI芯片制造商来说是个巨大的挑战。在AI技术日益普及的当下,传统制造商必须考虑如何更高效地整合AI技术,以增强自身产品和服务的竞争力
好文章,需要你的鼓励
瑞典央行与金融机构及国家安全部门深化合作,共同应对网络威胁。今年5月,瑞典遭遇大规模分布式拒绝服务攻击,政府和金融机构受到严重冲击。总理克里斯特松承诺增加资金支持,建立更强大的公私合作伙伴关系。央行将举办第二届在线网络安全挑战峰会,鼓励金融机构提升网络安全能力。瑞典金融协会敦促建立危机管理机制,与国家网络安全中心等机构协调配合。
字节跳动发布Seedream 4.0多模态图像生成系统,实现超10倍速度提升,1.4秒可生成2K高清图片。该系统采用创新的扩散变换器架构,统一支持文字生成图像、图像编辑和多图合成功能,在两大国际竞技场排行榜均获第一名,支持4K分辨率输出,已集成至豆包、剪映等平台,为内容创作带来革命性突破。
工作压力源于大脑储存混乱而非系统。本文介绍5个ChatGPT提示词,帮你将工作压力转化为结构化行动:优先级排序任务清单、快速撰写专业邮件回复、从冗长文档中提取关键信息、生成问题解决方案、高效准备会议内容。通过系统化处理工作事务,将分散的精力转为专注执行,让大脑专注于决策而非重复劳动。
红帽公司研究团队提出危险感知系统卡(HASC)框架,为AI系统建立类似"体检报告"的透明度文档,记录安全风险、防护措施和问题修复历史。同时引入ASH识别码系统,为AI安全问题建立统一标识。该框架支持自动生成和持续更新,与ISO/IEC 42001标准兼容,旨在平衡透明度与商业竞争,建立更可信的AI生态系统,推动行业协作和标准化。