别慌!国产ASIC推理性能,是英伟达H100 的20倍。


01. 
ASIC速度是GPU的20倍
国产ASIC架构,颠覆英伟达GPU
在AI芯片这个行业里,之前主要关注的基本上都是英伟达的GPU架构AI芯片,不得不承认英伟达的GPU架构在AI硬件,市场占据是绝对的主导地位的,但英伟达的好日子是不是到头了,我们先不要下结论,国产ASIC架构的崛起这是一个事实。例如最近Etched公司的Sohu芯片,以其专为Transformer模型设计的ASIC架构,不仅在推理速度上实现了超过NVD最强GPU20倍速率,更关键的是功耗控制只有英伟达的1/3,我多次有写过关于ASIC架构优点的文章,大家有兴趣的可以翻看历史文章哟!AISC芯片一定会替代掉英伟达的GPU。华为、寒武纪AISC芯片架构的优缺点详解。AISC的弯道超车(强烈建议收藏)
02. 
Sohu性能介绍
Sohu芯片是专为Transformer架构设计的ASIC芯片,它是直接将Transformer架构蚀刻到芯片中,实现硬件级别的优化。
采用台积电的4nm工艺制造,具有高度的集成度和低功耗特性。FLOPS利用率超过90%,远高于传统GPU上的约30%利用率。
推理性能大大优于GPU和其他AI芯片,高峰推理训练速度是GPU的20倍,尤其针对Transformer模型具有显著优势。
测试结果,显示Sohu每秒可处理超过50万个tokens,远超过英伟达H100 GPU的23,000个tokens/秒和B200 GPU的约45,000个tokens/秒。
一台集成了8块Sohu芯片的服务器在AI大语言模型推理性能上相当于160块英伟达H100 GPU。
03. 
颠覆GPU,势在必得?
一、国产ASIC架构的优势
1、与GPU架构相比,国产ASIC架构是更多的晶体管用于计算用途,例如华为、Hwj等,他们主要是为了减少用于存储器空间,来实现高计算密度和低的功耗。这是ASIC架构的最大特点。另外,很多国产ASIC架构都采用了单一大内核的设计,这一设计方案的好处,是可以减少用来协调不同内核的低效计算,进一步提升了计算效率,这也就是大家经常会看到同一档次的AI芯片,ASIC架构可以最高打出成倍算力的主要原因。
2、ASIC芯片在处理Transformer模型时,非常占优势。因为Transformer模型需要大量的矩阵运算和线性代数计算,而国产ASIC架构正好是针对这类计算进行了优化的。所以很多大厂在用国产AI芯片处理Transformer模型时,国产ASIC架构不仅发挥出超高的算力,还能更低的功耗,正好符合上面节能排放的要求,这是最近受欢迎的主要原因。
二、颠覆英伟达GPU架构的潜力
我觉得颠覆GPU也不是不可能的,上面给大家分析过性能,在推理速度上不断进步和优化,已经实现对英伟达GPU架构的全面领先。再其次就是在功耗控制上,国产ASIC架构也具备显著优势。由于采用了优化设计,国产ASIC架构在功耗控制就不用介绍了,我觉得主要是后面要解决的就是生态。
因为国产ASIC架构也正在不断完善。我相信未来越多的AI公司开始采用国产ASIC架构来构建自己的AI系统,加上大厂也在使用国产ASIC架构的芯片,然后生态系统将逐渐壮大。这对于推动国产ASIC架构市场中应用和普及度,都是非常重要的一步,不怕你不用,就怕你少用,不管生态怎么样,都要建立自己的生态,一定要先用起来,符合自己的国情才是最重要的。
我本人是有理由相信国产ASIC颠覆英伟达GPU架构是有很大的概率的。现在“小院高墙”的环境,不得不让我们自力更生,既然选择相信,那为何不继续支持呢?
到顶部