越来越多的证据表明,人工智能芯片的供应紧张问题正有所缓和,一些购买了大量英伟达H100 80GB处理器的公司现在正试图转售这些处理器。
目前,据悉用于人工智能(AI)和高性能计算(HPC)应用的英伟达H100 GPU的交付周期已从8-11个月大幅缩短至3-4个月。
据报道,一些公司正在转售他们的H100 GPU或减少订单,因为这些芯片的稀缺性开始下降,并且维护这些尚未使用库存的成本也很高。
此类情形与一年前相比出现重大转变,当时获得英伟达的Hopper GPU是一个重大挑战。
目前人工智能处理器供应短缺的缓解还表现在,从AWS、谷歌云和微软Azure等云服务提供商租用英伟达的H100 GPU变得更加容易了。
例如,AWS推出了一项新服务,允许客户安排更短时间的GPU租赁,解决了之前芯片可用性的问题,这导致获得人工智能芯片的等待时间在减少。
尽管芯片可得性有所提高,交货时间也大大缩短,人工智能芯片的需求仍然远远超过供应。
特别是那些自己开发并培训大型语言模型的公司仍然面临供应问题,很大程度上是因为他们需要的GPU数量过于庞大。这些公司在获得所需处理器或容量方面仍面临着几个月的延迟。
也正因如此,英伟达H100和其他处理器的价格并没有下降,该公司也继续享有高利润率。
不过,随着诸多英伟达处理器的替代品接连问世,例如AMD和AWS的处理器,该市场可能会迎来更加平衡的局面。
还有一点原因是,各公司对人工智能处理器的支出也变得更加谨慎了。
无论如何,就目前而言,市场对人工智能芯片的需求依然强劲,并且随着大型语言模型越来越大,对计算性能的需求也越来越高。