
科创板上市后,“国产GPU第一股”摩尔线程(688795.SH)12月20日召开了首届MUSA开发者大会,公布了新的GPU架构和基于该架构的三款芯片。
摩尔线程被认为是国内GPU公司中最像英伟达的一家,其产品结构与英伟达有一定相似度。与英伟达的迭代节奏类似,2022年至2024年,摩尔线程每年迭代一个GPU架构。2022年的春晓架构,代表产品包括第一代面向云计算的AI智算板卡S3000,2023年推出的曲院架构,对应第一代训推一体智算板卡S4000。2024年发布平湖架构并推出基于该架构的板卡S5000。
此次推出的新架构花港,其算力密度比前一代提升50%,支持从FP4到FP64的全精度计算,支持十万卡以上规模智算集群扩展,并内置AI生成式渲染架构。此次推出的三款新芯片是华山、庐山和长江,分别是AI训推一体芯片、图形渲染芯片和SoC(系统级芯片)。
业界正通过支持低精度、进行混合精度计算来提升计算效率。摩尔线程AI智算板卡支持的计算精度范围也有所扩大。摩尔线程上一代板卡S5000开始支持FP8精度,新一代的华山则开始支持FP4。英伟达目前出货的主力芯片Blackwell也支持FP4精度计算。
从算力看,摩尔线程此前公开了一些AI智算板卡的性能数据。其中S4000板卡在FP32、TF32、FP16、INT8精度下的算力分别为25 TFLOPS、49 TFLOPS、98 TFLOPS、196 TOPS,最大功耗450W。对比2020年英伟达推出的A100 80GB PCle(80GB),A100在上述精度下的算力分别为19.5TFLOPS、156TFLOPS、312TFLOPS、624TOPS,最大功耗300W。相比之下,S4000在一些精度下的算力表现和功耗表现不及A100。
上一代板卡S5000此前未公开具体性能,此次开发者大会上,摩尔线程创始人、董事长兼CEO张建中则透露了一些信息。他表示,在DeepSeek-R1全量模型分布式推理场景中,S5000的Prefill Only、Decode单卡吞吐量,分别是H20等常见芯片产品的约2.5倍、1.3倍。新一代华山的浮点计算能力则介于英伟达Blackwell和Hopper之间,华山的访存带宽与Blackwell接近,高速互联带宽在Hopper和Blackwell之间。
AI智算板卡支持的集群规模也在提升。此次摩尔线程推出了万卡智算集群。张建中表示,2024年摩尔线程推出第一代千卡集群,今年达到1万卡,接下来还要做10万卡、50万卡、100万卡。

张建中表示,万卡智算集群的工程难度来源于超大集群供电及液冷散热、超大规模互联组网及通信、集群训练有效算力、训练稳定性与可用性、模型训练精度与效果测评等方面。大模型训练的发展趋势则包括模型走向万亿参数、训练集群规模迈向10万卡、训练精度从FP16走向FP8和FP4,未来需要解决一系列挑战,包括实现高效并行训练、实现FP8和FP4低精度训练、实现高性能通信等。
摩尔线程此次还推出了具身智能仿真训练平台和AI算力笔记本MTT AIBOOK。
摩尔线程12月5日在科创板上市,发行价114.28元/股,随后股价波动颇大。12月11日该股收盘价超900元/股,随后股价有所回调,12月19日收盘价664.1元/股。摩尔线程尚未盈利,截至今年6月底,公司累计未弥补亏损16亿元。该公司预计2027年可实现合并报表盈利,但相关前瞻性信息具有不确定性。
一鼎盈配资-一鼎盈配资官网-平台配资-股票配资开户网提示:文章来自网络,不代表本站观点。