近日市场传言说国内互联网大厂对于NVIDIAH20订单未来可能大幅砍单。传闻称,主要是因有要求部分购买H20的企业要报备,需备注使用说明不用其他方案的原因”,从而担忧H20会被砍单。
这一消息似乎也影响了NVIDIA的股价。上周五NVIDIA股价破新高974美元后剧烈回调,单日从大涨5%至大跌5%,虽然主要是主要受期权影响,但一定程度上也可能与此相关。
近期,有机构对于此时采访了对于NVIDIA市场部的领导进行了访谈。具体答复如下:
Q:H20组成集群的性能与Ascend 910的比较?
A:服务器卡间瓶颈,服务器间瓶颈。卡间互联910的互联带宽是H20的一半,卡间互联性能下降一半。
服务器间互联,NVIDIA有一分半IB交换机,没有替代解决方案。国内是400、800G集群交换机,算力损耗比较大。
Q:H20的NVLINK是900GB/s,H800只是400GB/s,可以达到吗?
A:NVLINK对NV不是高端的,很成熟了,H系列都可以支撑。
网络带宽支撑这么大,可以买更多的卡达到,NVLINK的传输速度可以领先的。异腾达不到的,现在是400G,8卡一连就是200了。
Q:近日是否有中国的订单大量砍单的情况?
A:截止昨日,H20的中国订单一直稳定,市场部尚未接到大量砍单的现象。
Q:请领导介绍一下H20的优势和劣势?
A:NVIDIA作为全球AI芯片的领导者,无论在硬件上还是在软件生态上都是最成熟的。H20是高缓存、高带宽,但是算力性能差,这主要是禁令的要求和限制。
H20卡算力性能与910相比差了一些,但是,缓存与带宽远比910高,带宽是910两倍。
NV有NVLINK架构,H20可以是通过多卡使用、多卡堆叠模式,完全超越910,甚至突破H100。
Q:中国市场的业务拓展情况?
A:H20就是为中国推出的定制版,公司十分重视中国市场,已经启动H20的推广,委托中国国内最强的技术团队,届时,现场有千台H20组网集群,大家一定会看到非常震撼的效果。
NVIDIA近况交流要点:
H20:
1)专供国内的训练卡,目前已确定数量在40w张左右,随着国内互联网等企业对该卡的接受度增加,有较大提升空间;
2)价格下降,1月份定价为2.3-2.5w美元,2月份下降至1.2-1.4w美元,主要系910b的压力;
3)单卡性能为910b的60%+,单卡算力为H100的20%;
4)集群性能优越,主要受益于NVIDIA NVLINK技术。
B100:
1)目前市面上最高端的训练卡,性能为H100的三倍多;
2)24年7月份开始小批量供应,25年起起量供应成为主力训练卡;
3)按照H100算力和客户价格接受度预测在3.6-3.9w美金之间,不会超过4w美元;
4)分为低算力/高算力两种,对应散热方式是风能/液冷, 占比60%液冷+ 40%风能。
NVIDIA25年及以后:
1)25年训练卡的总量约为500w张,推测b100/h200/h100分别为200w/100w/100w;
2)23年至25年,NVIDIA训练卡将处于高峰期。预计在26年,随着AI应用广泛存在,AI服务器的增速将逐渐平缓。这一趋势将促使通用服务器逐渐摆脱AI服务器的冲击,并扭转之前的负增长态势。预计在27年,通用服务器市场将恢复正增长。
格局变化:
1)预计在27年,通用服务器市场将恢复正增长。
2)AI服务器代工无影响,推理+训练此消彼长,总量不变;
3)可能影响卡的代工厂商,训练卡25年增速放缓,其代工厂寻求其他产能合作。