1、高端计算芯片进口有限,或是国内人工智能服务器的瓶颈之一。2022年10月7日,美国商务部工业安全局发布了一份关于从中国出口先进芯片的新监管声明,该声明不计算出口到中国的每个工作的比特长度乘以TOPS。Nvidia A100是TF32电源,换句话说,我们测量了156.32=4992>4800,传输速率为600GB/s。由此,我们可以得出结论,性能大于或等于A100 GPU的高级计算机芯片在美国受到出口限制,使用英伟达A800服务器作为当前可能的替代品。对于浪潮NF5688M6,NF5688M6是Intel最新的两个Ice Lake CPU和Nvidia’s的CPU。NVIDIA AI服务器专为大型数据中心设计,支持连接到八个最新NVIDIA交换机的A800 GPU。与核心硬件相比,NF5688M6使用了NVIDIA China A800芯片的特殊版本。浮点计算能力在视频存储器带宽和存储容量等性能指标方面,这基本上与先进的A100计算机芯片相对应,主要区别在于芯片的数据传输速度。大约占A100的三分之二。
2、英伟达的其他AI GPU芯片不受出口限制的影响。鉴于美国目前对GPU芯片的限制主要集中在先进的计算能力上,如果再加上进一步的限制,A800等大型计算芯片未来可能面临进一步限制的风险。从NVIDIA的产品线布局来看,A100、A800、V100和V100除了H100等先进的计算机芯片外,还有A2、A10、A30、A40和T4。在这些芯片中,A30的浮点计算能力最强,输出功率为82.32=2624<4800,因此不受出口限制的影响。
3、国产人工智能GPU的性能将持续提升,未来有望实现国产替代。目前,国内人工智能GPU制造商主要包括阿里巴巴、华为和寒武纪;包括田启勋等人。以华为的升腾910为例,该芯片使用7nm工艺集成了超过496亿个晶体管。它可以提供320TFLOPS的FP16计算速度或640TOPS的INT8计算能力,略高于英伟达A100的FP16运算速度(312TFLOPS,无英伟达稀疏技术)。我们认为,只有在芯片处理能力方面,一些国产芯片才能赶上国外主流芯片。随着国产生态系统的逐步打磨,GPU性能的提升有望推动国产替代。