有意见 | 养兵和用兵缺一不可，看清训练和推理，才知道Groq LPU为啥快原创

根据Groq官网的介绍，LPU是一种专为AI推理所设计的芯片。但要训练大模型，仍然需要购买GPU。

据说，名为 Groq 的初创公司带着史上最快的大模型和自研芯片LPU来了。经过网友测试，Groq每秒生成速度接近500 tok/s，碾压GPT-4的40 tok/s。

根据Groq官网的介绍，LPU是一种专为AI推理所设计的芯片。但要训练大模型，仍然需要购买GPU。如果把训练必做养兵千日，那么推理就是用兵一时,两者缺一不可。Groq LPU的快速输出，还是离不开背后GPU的数据训练。因此结合训练和推理的总成本来看。如人工智能专家贾扬清分析称，Groq综合成本相当于英伟达GPU的30多倍。

“有意见”留言板

@卡卡卡卡西：面对大模型，船大不好掉头的反而是芯片厂商，大家都知道大模型更需要的是访存密集型芯片，但现在的芯片厂商都是基于自己干了那么多年的芯片架构进行优化，没勇气从头再来，所以OpenAI奥特曼才想自研芯片，这也才有了Groq的震撼登场。

@贰言：Groq的自研LPU比英伟达的GPU性能更强，这对英伟达等传统AI芯片制造商来说是个巨大的挑战。在AI技术日益普及的当下，传统制造商必须考虑如何更高效地整合AI技术，以增强自身产品和服务的竞争力

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

有意见 | 养兵和用兵缺一不可，看清训练和推理，才知道Groq LPU为啥快 原创

来源：至顶网有意见频道

2024

02/21

14:25

分享

点赞

NVIDIA Nemotron 3 系列开放模型： 击穿AI“工程墙”开启“Agentic AI”的“Linux时刻”

W.AWARDS金网奖2026未来商业计划领航秀峰会收官

人工智能使用大揭秘：OpenRouter公司百万亿规模数据分析报告

智能化与全球化并进，IBM中国下一个40年思考

通用汽车推出原生Apple Music应用并支持空间音频

GMV推进卫星导航技术助力自动驾驶运输与物流发展

英伟达考虑增产H200芯片满足中国市场激增需求

IBM推出开源智能体CUGA 任务完成率超五成

OpenAI支持的生物技术公司Chai Discovery获1.3亿美元B轮融资

八问智能时代：西云数据的八个答案

塑造2026年的八大智能手机趋势

AI架构师荣获《时代》杂志年度人物称号

该需要多少 NVIDIA CUDA Cores ？

未来，就在我们手中

RTX5090震撼发布，一文带你看懂英伟达CES2025发布会。

深度学习最佳 GPU，知多少？

一文读懂 GPU 资源动态调度

2024 AI服务器市场竞争格局

英伟达最新Blackwell机板配备四GPU、双Grace CPU且功耗为5.4千瓦

超大规模集群：CPU&GPU部署与实践

趋势丨速度提升数十倍，用光子计算重塑AI算力集群

Google Cloud发布下一代TPU和GPU集群 增强AI Hypercomputer堆栈

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | 养兵和用兵缺一不可，看清训练和推理，才知道Groq LPU为啥快原创

NVIDIA Nemotron 3 系列开放模型：击穿AI“工程墙”开启“Agentic AI”的“Linux时刻”

Google Cloud发布下一代TPU和GPU集群增强AI Hypercomputer堆栈