最新国产算力专家纪要,采购寒武纪16万张卡?(1.3万字)


纪要比较长,建议点击关注 再看 收藏。
前台比如今年全年预期能够有多少?其实H20在中国的接受程度初期并不好。你比如说像我们四月份五月份刚拿到货的时候的接受度并不好。那其实是进了七月初的时候,阿里经过测试使用之后,发现这个东西可能还可以用。所以才出现了这种上百个亿的这样的订单的出现。那现在看物料肯定是满足不了我们现在的需求了。到年底之前,可能如果阿里可以用的话,我觉得有可能会带动一些二线的客户会往这个产品上来转。
我觉得可能会有这样的一个趋势,因为之前的大家对这个产品的预期并不是特别的好。应该是一个怎么讲好呢?应该是一个中性到乐观之间的,大概我个人可以给他打75分到80分左右的这样的一个水平线。
比如你认为比如说针对H20的话,后续就有被禁的一些风险吗?这件事情最近传传的非常火,尤其是大概是两周前。两周前我们在美国的一些消息就已经说有可能要进H20了。但是这个禁售有两个说法,这个两个说法,我觉得第二个说法可能可可信性更高。
第一种说法是说美国商务部对这个VDR不满,对吧?因为NVDR你老出我出不规定你就绕墙。因为NVIDIA跟美国政府的关系并不是特别的好,所以有说法是美国商务部要进H20,这是第一种说法。但是我觉得可能性不高,因为他能做H20就有可能做H28、H30对吧?这个东西你让我怎么做?
第二种说法是美国要把HBM的这个高带宽内存,他要把这一项技术对中国进行禁售。那如果这项技术进行禁售的话,就不只是H20了。所有使用了HDM这种高带宽内存的所有的GPU卡,中国就都买不到了。明白,因为如果HM的内存如果被禁的话,那其实连华为910B都已经生产不了了。你以我个人的了解是说市面上有人在传说产量存储,曾经说他们要做这个HBM中国自己的HBM的内存。但是好像我个人觉得大部分是一个在吹牛的状态。
那那比如你认为这个HI就是高端的HBM这个进的可能性或者概率有多大?我们现在觉得非常,这仅限于个人猜测,这个东西这涉及到政治和两国政府之间的东西,我很难有一个特别准确的。但是从我们得到的消息来看,这件事情很有可能会发生。而且这一招要比进GPU什么的很多了。等于因为你你看你进了这个GPU,那我可以生产更低端的。而且你进了这个东西之后,华为还能生产替代品,对吧?但是如果你进了HBM这种高带宽内存,那等于连华为都给杀死了。
也不在这个趋势来看,我觉得这个可能性很高。而且一开始传出这个消息并没有什么时间点。但是我美国一个朋友私下里说,他们打听的消息就是说有可能是在十月份左右。这个消息最开始是什么时候开始传的?这个消息就是应该是两周前,不到两周前应该是。我想一想,对,差不多不到两周前,应该是啊上个星期的星期四星期五的样子。
OK明白,专家再跟您确认一下H20的话,就是您说这5000台是Q2吗?整个全中国大概Q2差不多。OK明白知道大数都在我们这儿,和其实是这样的,这个市场上大家多多少少都卖一点,但是最大的单就来源阿里这个单子。然后这个单子基本上就是我们的华山两家分了,所以大头还是明白。
那比如这5000台的话,阿里能能占多少?这5000台里面阿里占的不多。当时那5000台里面,基本上是头部这几家差不多均分了。就是腾讯的、阿里的、百度的,基本上大家都要了一些。是七月份这张单子是100个多亿的那这么算就应该算QQ3了。
Q3,明白,那比如Q3和Q您说要肯定拿不到那么多。他的表Q3和Q4的话,整体的H20你就您估计的话大概能出多少?原来我们认为最乐观的估计就是美国也说可能我们能卖十几万台。但是从我现在的状况来看,不好说。因为a media的物料这个事情很难,你也知道它的预测性很低,他的整个后台的生产和物料供应是所有厂商当中做的最烂的。
现在技术就最好,这个没办法。从我现在了解的状况看,应该五六万台是一个比较乐观。但也有可能就像我说的,也许十月份真的就崩起了。这个五六万也是一个相对比较乐观的一个数字了,对吧?
对我说的是五六万台机器,一台机器里面有八个。明白,比如如果就比如我们不说的话,就是如果中性的话,你预期大概有有多少机器出来?3到5万台?3到5万台OK明白。比如这个如果看这3到5万台的话,大概相应的客户大概是怎样一个分布?目前会有一些,就比如三三季度时候可能会更加清晰一点。是什么那就我说三季的。
您说现在看到的这个市场上最大的需求就来源于阿里,其他的都是一些零散的几百台的这种。那我相信后续因为阿里的成功,肯定会带动一些人拉进来。像百度自己美团,还有一些星汉大数据这些有一些做算力的公司。你也知道这个东西现在在股市上可以炒,他们多多少少都会进的。但是现在看我觉得阿里肯定是一家独大。但从订单看啊,现在阿里是一家独大,但后续的需求有可能字节会超过他。但字节也有一个难讲的东西,因为字节有一部分数据中心在向东南亚转移,我们还要再去看一看去会怎么样。
OK明白安德敏克如果从最初然后到调到五六万,然后再调到比如说中心的测试万,这个是仅仅是因为政策的一个影响吗?就是政策影响的一个下调。不是政策的下调,这个影响有几部分,最大的影响其实就来源于维迪亚自己本身它的供应物料能有多少。
第二件事情是说国内的客户就是H20,毕竟现在只有头部的客户拿到了。一些小型的中型的客户,他还二线的甚至三线的客户都还没拿到机器。就是这个机器到底做做起大模型来到底会怎么样,还很难讲。所以需要有一定的时间让客户去做测试,对吧?这是第二个原因。
第三个原因是说你也知道有国家也打过招呼,就是尽量不要卖H20,毕竟是个英美的鹦哥的产品。明白,那比如根据您您对比如针对你说对客户的了解的话,比如说头部的这些大厂的话,当前买H20主要是用在训练还是用在推理?都是训练的,所以你没必要用这么,没有人做做推理的,没必要太贵了,性价比太低了。
发言人 09:35
明白,无论是什么客户买,你说你说阿里也买好还是大码,就是相应的一些其他小公司也买,都是用来做训练的对吧?没有人用它做汇率T2,你太低。明白。那那比如针对于你说推理的话,就是这个市场如果做推理的话,大家一般不太用这么高端的卡。我们认为其实对普通的客户来说,大家都不用用服务器级别的卡,用那个090就是电脑或者工作站上用那个是性价比最高的。好,最终在这个大家都不是在一个数量级上的,都是几十万上百万片的那种。
明白,专家这边再跟您确认一下,这边说针对于字节和阿里,因为他们在东南亚也有数据中心,对吧?这个也是他们东南亚水准,也是被禁的这种情况吗?如果他的法人仍然是中国的人的话,或者是中国投资人的话,按照美国的法律也是被禁的。
明白,那目前OK你说BIS当时的禁令是这样的,他首先禁掉了45个国家,对吧?这几个国家分成了D,它它是一个D开头的,就是defense的国家和敌对国家的分类叫1234。第五类是最严重的,然后第五类是不能申请特批的,1234类的国家都是可以去申请特批的。你比如说甚至连巴基斯坦、越南都可以特批。但是中国是属于第五类,是不能特批的。然后这个禁令说说如果你搬到巴基斯坦是可以,就是你搬到东南亚,比如说搬到马来西亚是可以绕过的。
但是美国商务针对中国还有一个另外的禁令,是跟这个GPU的禁令没关系的。是说禁止对中国科技企业的法人单位出售,这是另外一个两个禁令。所以他们即使搬到了那边也很难,但他们有很多种办法搬到那边,为什么呢?因为你比如说在国内就闲聊几句,在国内你比如说像H100、H200,现在在国内都能买得到。从深圳都进得来,哪儿都有。那美国加拿大的卡,美国的倒少,美国的基本上没有。韩国的、台湾的、新加坡的、马来西亚的到处货都能进。中国很多个口岸都能进,但主要是以深圳为主,那这是个走私的能进来。
第二个是说。进来之后,这些大厂其实从符合法律的角度来说,他们是不敢买的。那他们就会架一层隔离墙,这种隔离墙是怎么办呢?他们跟一些公司签署了算力的租赁协议,然后这些公司把这些卡买下来,就其实是一些手套公司,买下来之后建成数据中心,然后把这个算力租给像自己对吧?阿里他们。然后这样的话,如果真的美国政府制裁起来一些,只能制裁那家手套公司,就不能制裁他们,这是一块。
第二块,他们去东南亚基本上也都在玩这种套路。要么是说在当地找一个非华籍的人,就是你在马来西亚很多华裔的东南亚很多国家对吧?新加坡他们就是找这样,要么是找代理人制,要么就是能控制在别人手里,要么就是就是采用国内类似的这种可租赁公司的形式。
明白,比如说针对于大陆的话,刚刚您就是您讲的这种,是非正规渠道进来的卡,大概数量能有多少?比H20卖的多,我跟你说真的市面上飘着几万片的。这是一个不太官方的统计,但是我们跟这些客户,什么乱七八糟糟糟的聊天,都是一进中国就是1000片为单位起。OK,那那表示你看如果我们看算力租赁价格的话,你说你说这种非法进来的是有可能。这也是导致硝酸酸碱组织进行下价格下滑的一个主要的原因。一个是下滑的这个原因,另一个也跟我们自己的市场竞争有关系。
您是做金融的吗?还是做什么的对,我是做金融相关的。您做金融相关的,你可能你肯定知道execution就是华为的那家公司对吧?他有协议明年要上市。
他对赌协议里面签的是说这家公司的市值要做到570亿。那570是什么概念呢?大概相当于我们浪潮信息现在上市公司的市值。我们的股票大概三十多块钱的时候,市值差不多是570亿人民币左右。那我们的营业额差不多是,你看一年700个亿左右,对吧,现在x fusion大概也就三百多、四百多,最好的时候能做五百多。
照着这个状况,他肯定是要输掉这个对赌协议的。首先在上上饶市,这是一个说法,他市值也做不到。所以我们有一些朋友,甚至以前的一些同事们,也在华为在SQ上,我们也聊天。
他们说他们内部的问题是说不惜一切代价,从今年下半年开始抢这个市场上的revenue,无论任何客户的。所以我最近看见他们在市场上的价格非常的低,冲的非常的猛。他们要把这个remo冲上去,再利用华为有一些网安项目,像这个x fusion去输送一些利润点。这样的话他们可以让他们的money ready看起来比我们好一些,这样的话可能他们还有机会做到这个上市的市值570,所以赶到这个时间点上了,竞争也比较激烈。
另外一块是说从整体服务器的市场来看,其实如果你拿掉AI的话,整体的服务器市场是在萎缩的。这个萎缩的点大家观点不一,就是方向是一致的,但是萎缩多少,观点不一致。比较乐观的,说是萎缩了十个点多一点。但是从我个人的感受和一些其他公司的感受来说,这个市场可能至少萎缩了20个点以上。但是AI的服务器这一块现在来看因为缺货,大家多多少少还赚一点钱。但问题是华为超聚变这么搅局,大家整个赚钱效应又没了。其实这个是太多了,这个玩家太多了,应该洗牌了。
那天今年6月底的时候,我们参加英特尔的发布会,闲聊起英特尔的发布会,这个还不是全部厂商的,我数了数41个。也就是说在中国阿猫阿狗谁都能做服务器。这个市场是够大,但是也不至于这么不健康。什么产业能这样?所以对大家来说,这个产业可能就是我个人而言,我做这个产业可能需要找一个契机进行一次洗牌了。
明白,那比如专员我这边再跟您确认一下,你说针对H20的话,当前比如说针对已经卖了5000台,就是现在单价和毛利率大概是这样的一个水平。然后后续的话你说如果洗牌的话,像因为这种产品,你说尤其是毛利率的话,就是对于咱们来说会有这样的一些变化吗?我觉得后续也不会现在这么讲,就是AI的服务器可能比我们传统的服务器的毛利率要好到3到5个点。但是这个基于超聚变现在这个状况,把这个利润点可能都已经达到了三个点。就是比传统服务器好的水平已经可能已经到两个点,三个点也就这个水平了。就是他把这个本来可以赚钱的机器都打没了,毛利率也打没了。
那后续如果说像我刚才跟您说的,如果说一些大的头部厂商进来之后,因为他们采用的方式都是by sale或者是AVP的这种方式,那这种方式其实是一种类代公式的方式的,所以我们的毛利率也很难有明显的提升。就像简单的说吧,就像去年的H100那么缺货,我们的毛利率也没见多少是吧?OK明白。那比如下半年的话,你说H20单价和毛利率我们会有怎样的一个预期?我觉得单价也就把H20的单价基本上也就这样了,它不会涨太多,也不会跌太多。
毛利率大概会比传统服务器好个两三个点,也就这个样子。基本上以三个点为单位差不多,还是维持在这个两三个点左右。对对对,就这个样子,不会有什么特别大的,主要这个产业竞争太透明了。然后现在你要想赚点钱,基本上就得靠你手里有物料,客户着急,能拿一点,其他的你很出一些真正的价格上面去。因为超大型的客户的价格,你比如说像你的价格都是跟vidia谈好的。我们根本就加不了钱。明白,专家刚才你还是还有针对于省层的910B的话,今年上半年大概就是你能看到大概有多少?因为910B我并不是他的专家,但是我个人估计他可能在1万,好吧,你好,就是1万台左右的服务器的OK。
那比如说目前来看的话,如果我们分客户,你说就比如类似于政府制蒜类,然后运营商类,以及比如说BAT等互联网类,相应会对服务器会有怎样的一些倾向性呢?就是都是能买H20,先买H20,然后再以其他做辅助吗?还是怎样?是这样的,互联网巨头是这样的,很简单,就是什么性价比高他就买什么。如果有H200或者H100的话,他肯定首选H200、H100。那现在在合法的范畴内,H20已经是他们的最佳选择了,这就是阿里能把放出来的原因。
后续可能会有更多的客户release,那从客户再就是一些其他的,像您说的像金融,一些政府类的那这些客户怎么讲好?如果他着急用,那没办法,他可能也只能去买一点。但凡他能够等,或者是有其他办法可以接受的话,他基本上都会去转到910B上去。因为国家打过招呼,包括对我们也都打过招呼,跟客户也打过招呼呗。你比如说在一些比较知名的院校或者是研究机构,这些人都没说,直接给我们的人就说了,就政府就是说不OK。比如我们看910B大概这一万台服务器的话,大概是怎样的一个销售的一个分辨率。按客户类型来看的话,大头还是在互联网。因为我不用想,没有办法,最这个就是AIAI服务器最大的需求来源于互联网。
这个应该这么讲,中国前十的客户占了95%以上的需求,这个东西的头部集中效应非常的高。然后这个在互联网里面是最大的需求。互联网之后应该是教育,然后是金融政府之类的。再往下因为政府和金融起来,还是因为政府在推动智算中心这件事情,对吧?跟国家有一些包括包括更新这些。从真正意义上的从技术角度来说,最大的就是互联网。第二就是教育,其他的都没什么。明白。比如针对互联网这些客户的话,就是相应的需求的话,你可以帮忙排个序,哪家需求可能更强一些,哪家需求可能相对来说会弱一些。
所有的卡都得加到一起的话,第一名要有自己。自己这级别是什么呢?就是百万张卡这种级别百万张。然后后面是百度、阿里、腾讯这三家,应该是百度和阿里差不多。可能百度越多,然后阿里然后程序腾讯要比阿里和百度要再小一点。然后他们的级别都应该是10万张卡,甚至几十万张卡这种级别再往下就是1万块卡一下的,像什么美团、拼多多这些,像什么华大街,像什么反正汉汉城就很多了。二线了就是二三线就是万块卡一下的。大概这类客户有个几十个。
再往下需求就小了,就是一两百台机器就够了,那种几千块卡一下的就多的是那种。明白,但是他们要想赶上这头部一家,那太难了,没有明白。我们接受跟美国一样,就是他要训练一个超大型的大,他这个金融投资太怎么讲?这个差异太大了,投资量数据运算量明白。但是专家就是你你刚才说这个排序的,我理解应该就是目前的一个存量市场,对吧?那比如如果我们看当前的一个各家的一个需求的一个紧张度来看的话,哪家需求可能目前来看就是呃需求意愿更强一些,然后哪家可能相对来说可能要先缓缓一些。就比如针对于需求总量来说,仍然是自己我相信是最大的。
第二就百度和阿里,但是H20的单子现在这个时间点阿里是最大的。但是我相信如果说字节接受了的话,字节的单子肯定会比阿里大。但是如果字节不接受,那他就得想别的办法了,就是别的卡了。
那难道目前是也在考虑910B吗?我所有的这些头部的客户都测过910B但是910B的都一样,910B现在的供应也有问题。华为微牛的成本也很高,他第一有问题,第二他卖的很贵,他卖的不比H100便宜多少,比H20还贵好多。明白,但你说除了H20和920B的话,那当前岂不是几乎就没有其他的选择我实话讲到今天为止,我见过的客户里面都没有什么在超大模型上的成功运动。在一些小模型上可以,我见过比如说昆仑的,曙光的,但都不行,都在超大模型上不行。
在超大模型上现在被证明了好用的就只有960和MVA的卡。其实是这样的,在禁售之前,AMD和和英特尔的卡就是它的高低系列,高低two,高低two BCD。这卡也有市场,但是现在看也都被禁了。然后天三天两头出个禁令的,别人也都不太积极做他们的东西,反正是,明白,主要理解的问题是说我就这么多产能,买的人还多,因为国家打个招呼,对吧?然后加上它的实用性,所以910B现在抢手的很,价格很贵,也供不上货。那大的家其实都在买走。
OK, 比如针对于91人民币的话,当前就比如尤其是头部客户大概会是怎样的一个存量的一个规模。每家大概就几千片小于5000的数字水平。没多少就一千多台机器,可能你这这就是这就是最多的,其实也没有达到万片的这个情况,对吗?我到不了。我记得510B有当时有一个最大的单子,是说腾讯买了才一万片,交到现在他们交了一年半还没交完。
明白。明白,所以所以如果我们看训练的话,可能主要依赖的还是华为系列的卡了,对吧?你说存量的卡也好,什么新买的HH20也好,还是比如说下半年即将买的H20也好,可能主要还是依赖于这些卡,相应的一个数量,然后看一下相应的一个整体的一个集群的一个算力水平。对对对,从如果对您来说可能值得关注,是说因为H20进来之后,它会拉高平均单价,数量可能减少,那它的这个增速还是很快的。整体会拉动服务器的市场的金额会涨,但我们预计数量会下降,年比年的增速依然很快。至于热点,主要是NV的supply到底能给多少,这个是整体的一个状况,就是整体的服务器还会涨,但是传统服务器在下降,AI的服务器在涨。
明白还是表针对于如果我们把它分成推理跟训练的话,就是去年相对来说还比较好,也就是比较正常一点,就是推理和训练4比6对吧?那比如今年的话,感觉各家一方面是由于卡的一些原因,另一方面的话可能就是由于技术的一些原因。感觉各家今年大家都在卷一些相应的一些应用。但是目前来看的话,就是从您的角度来看的话,在应用端的话,目前大各家都是怎样的一些解决方式?都是偏向于一些比如偏偏低的那些卡吧。这些卡的话当当针对于当前来说的话,是还是处于一种非常富裕的一种状况还是怎样?
怎么讲?我觉得是这样的,就是AI这件事情就被人给吵吵乱了。怎么讲好呢?我这是我个人的一个对AI这件事情的一个个人的观点和看法,仅仅限于您的,就是很多人把这就是生成式AI跟AI这个词给混到一起去看待了。
AI人工智能这件事情其实已经研究了大概二三十年了,对吧?一直都有。而且这一部分的需求也比较稳定,每年百分之二三十左右的速度在增长,那其实是没有突破的那生成式AI大于现在模型带来了两大改变。一个是说它的transformer的应用,就是它的生成式?这是一块。
第二块就是从技术的角度来说,在训练的从训练这项技术的角度来说,在genera I gentoo AI就是OpenAI宣布这项系统之前,所有的我记得中国当时还有很多那家公司是做数据标签的,您还记得吧?就是所有的要做训练的数据都是要打标签的,否则你很难训练好。OpenAI做的一项突另一项突破就是数据不需要打标签了。你就用互联网传统的信息技术,你就能进行训练。但是他的训练方法是最笨的一种状态。我们到今天为止,我们认为就是现在的生成式AI的这种从技术角度来说,它的这种AI的生成模式是最笨的最重载的一种训练方式。所以我们认为将来可能会有要么有新的技术会替代,要么就是会有新的算法来替代。
生成式AI带来的改变是它加快了这种人工智能的推进。最大的最好的方面就是对人形机器人这类的训练变得更好了。但你会发现在OpenAI,即使在去年就是OpenAI火成那个样子的时候,整个的我们内部看,就是把所有的AI的服务器都加到一起训练和推理的。加到一起的话,训练的卡是从年初大概1.5比8.5,就是总数是十的话,那这个训练的ramel只在1.5,剩下的8.5都是推理的。推理就是到年底的时候,差不多到了四六开的水平,就是说训练差不多是四多一点儿,然后推理仍然是6。并不是说推理变少了,而是说这个推理的现在这个算法它太笨了,所以他需要耗费大量的算力。所以像您看到的,就是咱们现在讲的这部分这个JAI的这种方式,市场在涨得快。
但是GTAI在我们业界内部的人看来是说,如果你要做这种真正做这种大数据的顶级AI的话,其实你是在训练一个类人类的大脑。这个大脑一定是越大越聪明,训练的数据越多越聪明,然后不停的调整参数,这是算法改进的问题,对吧?那从真正意义上来看,我们认为全世界最后能训练能剩下来的大脑不会超过十个,而且主要会留在美国和中国。其他的那些数据模型在我看来都是在炒概念,或者是说你早晚都会死的。
至于您说的是搭载在这个大脑上的应用的话,那其实在我看来就像你搭载在苹果上的一个APP1样的。就是我有一个特别聪明的大脑,然后你自己建立一套APP,然后用你的专业数据来训练,然后跟用你的数据训练出来的,调整了参数之后的这样的一个APP训练出来的效果会比这个大脑直接。因为大脑是一个通用的,他是懂所有的科学的。但是你比如说我自己做一个,我是专门做动画的,或者是我们我是专门写小说的,或者是我是专门做医学类的。我拿到的数据是你这个通用大脑拿不到的,我的数据训练出来的结果相对真实程度更高,参考价值更高,应用价值更高。所以这个才是APP这个应用。
这个场景早就在很早之前我们这个产业就定义过了。对普通的用户而言,你是不需要买那么好的机器的。你最终其实就是像微软今天在做的生意。我把这个大脑开放给你,你把你的训练模型放在我这儿训练。训练好了之后回来你自己就可以存在一个很小的机器上,你就可以用了。然后你如果想不断的更新,有了又有了新数据不断的更新。那你就拿着你的新数据,你的新模型重新到我这个大脑上重新来算,这就可以了。
所以我们认为这个产业的集中度将来是非常高的,它不是今天的这个传统应用的概念。就是等于说他建立了一个核心的大脑,这个大脑会不断的迭代升级。你做的越快,数据量越大,你这个大脑就是越聪明。但是到了一个专业领域里的时候,那就是你的数据,你的算法会形成独特的这样的竞争优势。这个APP才会对客户真正有意义。
这个大脑你去年的大脑到底有多大,其实没有任何意义,因为它没有真正意义上的应用。也就是说这个产业最终这个AI服务器到底走向何方,是取决于我们原来就讲过这个事情,就是AI服务器这个需求到底未来会走向何方。一定是集中式。然后小的客户应用端一定是一个小型的分布,分布非常的零散的,甚至于说他可能并不需要买H20。有可能找到你,你买一台PC都够了,这都是有可能的。
再大不同的数据规模,你买不同的数据定义,那最终的意义是可能一个国家只存在两三个大脑就够了。然后你去搭载的去你不同的领域去打。而且是这样的,到今天为止我们没有看到到今天哪怕到今天为止,我们没有看到任何一家基于AI大脑的创业成功的公司。就是什么概念呢?就是我们没有看到一家这样搭载了搭载在大脑上的APP成功创业的公司。而且在在不停的有人在做,美国在做,中国也在做。但是他们都死了,原因是什么呢?原因是他们自己训练那个东西,最终被迭代的通用的大脑被替代了。
就是很有意思。你比如说我基于这个GDP3.0做了一个应用,对吧?然后我去训练了一个应用,结果到GPET4.0出来的时候,他的通用大脑的这个诊断和数据能力已经超过了我做的那个。所以这家创业公司就会吃掉。其实并不是说他创业创的不好,而是说他自己做的这个应用的独特程度已经被这个大脑给超越了。所以现在是说你为什么要做大做快?像OpenAI、google他们那样,就是在这个领域里面你做的越大越快,你领先别人就会距离就会越拉越大。然后到一定规模层级的时候,才能留下空间让大家去做这个应用上的创新。
然后这样的话才能说产生一系列的或者一大堆的成功的这种小型的依托于这种大型的大脑的这样的一些不断的应用,他们能够盈利,才能保证这件事情。这是一个成熟的商业模式,有盈利,有创新,有有生产力的提升,然后才能形成一个创一个正正循环。如果说一直没有这个应用的APP的突破和更新的话,我觉得这个没准就跟挖矿一样,我有点就关了。但现在看我看还是偏比较乐观的,只是说他还处于一个高速发展的阶段,还不成熟。当然他因为他是实实在在的,我们看到了他有一些算力,就是在推动科技,包括劳动力效率的提升方面是确确实实有改善的。它不像挖矿,你就是纯粹的消耗电力,变成了一个记账本,对吧?所以虽然现在没有创新的公司没有应用,但是大量的人在做,大量的投入在有,而且我相信将来一定会有。所以相对比挖矿比起来,我认为会更乐观一些。
明白明白,比如针对于比如我再再追两个点,是国内的这个卡那个情况你说除了就目前来看除了910B以外的话,其他家的话就刚你讲都很难成气候。比如如果我们看,就比如相对于920B1万有一万的一个出货量的话,其他家大概是怎样的一个量的一个情况?没有超过5000的就是比例,假设有比例,然后一两千的话可能会有很多你像我们这样光的、寒武纪的都有,但是量都很小。
那那比如有哪一家有看到比如有类似于起量的一个趋势吗?现在看排在910B后面有希望的。我觉得曙光的和昆仑的可能还有点机会,其他的不咋地,都不咋地。这个是你认为是性能不行,还是可能比如说量产的节奏不行,还是怎样,我这技术不行。客户接受度不高。对,就是他的技术就不行。你比如寒武纪炒成那样,最后我拿着他的卡去百度测试,跟狗屎一样,我都跟你说OK。
那比如看如果我们比如看百度的昆仑的话,你认为它后续是主要是自己用于替代一些,比如其他的一些高端卡,还是可能会有一些外供的一些情况。昆仑已经在做代购了,昆仑已经不是昆仑芯它已经是一家独立的公司了。不光是单独给百度做卡了,他已经是一家独立的公司了。现在你比如说什么光盘,华山H3C我们这个车已经大喊口号,拥抱昆仑芯,全面拥抱昆仑芯。
明白,那就是他在出货的时候就不会有优先供给百度的一种情况了,对吧?已经没有了,就是我们可以直接卖了。OK明白。那目前昆仑芯的制程大概有多少,可能新的制程我还没有仔细了解过,实话讲因为我们不太主做他们,这个我还定不了。咱们目前还是注册,要NV的卡,比如说H20对吧?对,我们主要是做NBA为主。OK明白华北有,不瞒您说,这个不是很愉快。

明白了。比如昆仑的话大概出了多少?就比如相对于90B的话,它的出货量大概能有多少呢?
昆仑是这样的,昆仑现在问题是说它大部分并不是用在大模型上的,它的数量非常大,数量级别非常高,几万片都有。但是它主要用的推理性的低端的,就是其他家会买它来用来做来就是用来做推理,对吧?对,目前相应的客户你有了解吗?就是都谁在买?百度是最大的用户了,其他的零零散散的现在很多一些互联网类的用户,一些教育类的用户,大家也都有是都处于尝试或者是各种各样的阶段。
因为昆仑芯当年出来做的时候,百度背景,所以他们原来做的很多东西都是依托于百度的那个卡,去慢慢做一些改进的。所以一些看针对于百度的话,百度有尝试用困难区去做一些训练吗?现在他们据说在有一些东西做尝试,但是他们尝试的方向是不一样的。他们你比如说他昆仑芯给百度做了很多卡,是基于ask架构做的,它并不是GPU架构,就是在特定你比如说他在视频处理领域,这样的话它的效率更高什么的。这样的有一些这样的模型和自动驾驶,那里里面的有很多这样的东西。
OK,那比如针对于寒武纪的话,你看刚刚你也提到百度那边测不太行,那比如其他家测这边相对反馈,您这边有吗?不太好说,其实我见过很多客户测都测的不怎么好,我就不说明白了。明白。
比如看如果我们看国内的话,如果国内这些客就是如果国内这些客户如果做推理的话,主要的目前主要的推理芯片有哪些?就是会相对来说会集中一点,还是可能还是非常分散的一个情况。推理的客户仍然是本V家最大,94090独霸天下,剩下的很多公司都有,就是百花齐放,很多国内的没有形成说太优势特别大的。因为推理的卡现在这个技术难度并不是很高了,对,很多人都能做。比如4090的话大概有多大的市场份额?就比如在国内的话,80% OK,那还这么高。明白,然后剩下的然后剩下20%的话,就相对来说是比较分散的一个情况,对吗?对对对,OK。
比如目前就有了解到一些,比如说一些一些企业如果私有化做一些比如大模型的话,他们一般是用什么型号的卡?也是NV的卡吗?现在是这样的,如果你做生成式AI的话,因为对大部分你可以这么讲我不能说百分之百,但99%的客户编程语言都是空的,扩大的这种编程语言是NV的。所以对传统用户来说基本上都用AVI的卡。因为他的你要换成别的卡的话,你就你等于要其他的编程语言,要所有代码都要改的这对普通的客户来说简直就是灾难。
明白,要不就用NV的卡,要不就是可能就是用一些比如说能够兼容扩大的卡,对吧?我没有扩大不兼容任何人。我看要么就是你自己,就是你像互联网某一些互联网公司,或者是一些大型的科研机构。你比如说像中科院什么的这些或者下属机构,或者是军队的。他自己有这个编程能力,有自己独特要求的,他才会去用别的卡。
如果你没有编程和解码的能力的话,你就只能用NA酷达是不兼容任何其他卡的。你用了酷打就只能用NV然后如果你要用别的卡,你要么就是你要在原有的扩大上面加一个编程解码的东西,要么就是你自己底层代码重新写。明白,同时就是也看到比如一些你说运营商的话也也做也买了很多卡,然后做一些算力租赁。他们买的卡也主要是NV。对,主要就是MA去年他们比如说电信移动都投了好多标,他们也没拿到多少货,反正。明白。
但是如果我们看今年的话,可能主要供应商就是主要的采购商可能就是互联网企业的对吧?不有几块政府不是投了,各地有很多算力中心,这些算力中心后续会不会跟进,然后包括我说的那个厉害了,右手啥都给我都快了,会不会精彩。看你们,你们有点懵了,等以后不会带来多大影响,这个需要一点时间,可能不是现在也在测,但不知艾斯你真的他妈你就找我你。
就是阿里测的快,阿里拿到了卡号绑,因为没上市,他们就已经有测试卡了。然后他们可能觉得我觉得这张卡就已经可以了,所以就装这么大单子就算了,我自动买。还是比如如果我们看历史情况的话,一般都是阿里会先出大单吗?还是怎样评价哪个?太可惜了,当年没进的时候,最大的单就是字节的。当年最大去年这么算,去年是阿里、腾讯、百度三家加到弹幕,不要再了,就没有字节的,不是已经跟你们说了吗?但是如果就是我在想就是一个卡,就比如针对于新卡的话,一般是字节,又一般是阿里这边先先先就是先放量的。死了我就死了,不是我想死。这其实能拿到测试卡的时候,这几家人都手里就都有了。只是说他们测的快慢,他们对这个卡的性能满不满意,有没有替代方案,可能大家的决策链时间效率上可能还有一些差距的,因为应用毕竟不太一样。
明白,所以就比如针对H二点的话,比如说针对阿里这种客户的话,他们认为可能性价比高。但是你说针对自己的话,他可能他们认为可能性价比可能并没有阿里认为那么高,对吧?所以可能对动作上可能可能就是动作上可能会有一些不一样。对,也可能是说应用不一样对吧?觉得性价比高或者是说他能拿到的还有其他更好的替代方案吗?就是说他才能还能拿很多国外的货回来,对吧?就各有各的招了,在这种,明白,目前咱们针对于明年的市场会有一些预期,您认为明年还会巷还还会有明显增长吗?是这样的,我们觉得明年可能还是一个,如果不进的话,明年的增长依然会很快,为什么呢?
因为据我的了解,NV今年的产能仍然跟不上。你比如说我们现在H20官方说的说法,就是我给H20下单,他大概要六个月之后才能给我供货。官方的事实质上大概三个月左右。也就是说现在它的整个供应仍然处于一种它供应和需求仍然处于一种不太匹配的状况。所以我觉得一两年之内这个状况都可能没法改善。
我跟NV的人聊天,NV的人说他们现在拿到的订单,因为不光是中国的,还有美国的。然后他们觉得可能未来两三年他们的业务都会很好,这边来的确实也早。那我我了解一下,这专家我这边应该没有其他问题。今天非常给您时间,然后我这边消化一下。有机会的话,需要的话再找您做一下更新。然后非常感谢,谢谢。我记得还有一个好的,谢谢。
到顶部