英伟达应对出口管制:H20产品背后的猫鼠游戏

   发布时间:2023-12-07 10:18

【沃资讯】12月7日消息,近期,全球范围内的科技创新领域迎来一次引人注目的突破。人工智能时代的中国一直是英伟达的重要客户,但在2023年10月,美国更新了半导体和计算设备的出口管制政策,导致英伟达中国特供版GPU A800和H800自11月17日起将被禁止出口至中国。

据沃资讯了解,面对这一挑战,英伟达并未束手待毙,而是决定与美国政府进行一场猫鼠游戏,试图在监管的眼皮底下寻找突破口。为此,英伟达推出了一款新产品——H20,旨在绕过美国新出口管制,继续在中国市场拓展业务。

H20的浮点运算能力仅有296TFLOPs,性能密度仅为2.9,表面上看是一款超低性能的产品。然而,令人意外的是,即便是这样低性能的产品,仍然引起了一些公司的购买兴趣,并引发了美国监管部门以及英伟达竞争对手的担忧。

据悉,美国商务部长 Gina Raimondo近期点名英伟达,警告其停止为中国设计绕过出口管控的人工智能芯片。在这场猫鼠游戏中,英伟达的策略是如何运作的呢?

在美国出口管制中,3A090是一个关键的ECCN编码物项,专指高性能集成电路,当芯片的输入输出双向传输速率超过每秒600GB或算力超过4800TOPS时,即被归类为3A090,禁止向中国出口。为了应对此限制,英伟达过去推出了低配版但同架构、同样配备高带宽插槽版本的A800和H800,以绕过禁令。然而,这次新规更为严格,规定了算力总和和性能密度,导致几乎绝大多数高算力产品都不再能出口中国。

在这场文字游戏中,性能密度和总算力成为关键词汇。性能密度的定义存在两种说法,一是人工智能公司通常采用的FLOPs(每秒浮点操作数除以单位面积内的晶体管数量),二是MIPS(每秒百万指令数除以单位面积内的晶体管数量)。英伟达通过采用H20的HBM3e芯片,利用其体积上的高性能密度,可能是一种绕过规定的手段。

此外,总算力的定义允许一些巧妙的操作。英伟达的H20采用了Hooper架构,拥有多种核心,包括用于张量计算的TensorFloat32核心和脑浮点(BF16)核心。在测试时,可以只计算单精度和双精度核心,从而在算力总和上呈现较低的性能。

然而,H20的背后可能隐藏着更多秘密。尽管其浮点运算能力看似较低,但其Die尺寸却达到了814平方毫米,与高性能芯片相当。这使得H20的实际性能可能超过表面上所显示的数据。英伟达还可能在H20中搭载了TensorRT-LLM功能,通过软件技术提升GPU性能,以适应实际应用需求。

在这场猫鼠游戏中,英伟达展现了其软硬件结合的优势,不仅推出新产品绕过监管,还展示了其在硬件和软件方面的创新能力。同时,英伟达与SK海力士的合作也为其提供了内存方面的支持,共同开发HBM4以颠覆产业格局。

总体而言,英伟达在中国市场的重要性不仅仅体现在销售数字上,更体现在与人工智能公司的深度合作以及软硬件协同创新的裙带关系中。在这场猫鼠游戏中,猫和老鼠之间存在着一个灰色空间,两者需要相互协调以维持平衡,从而共同生存。

 
 
更多>同类内容
全站最新
热门内容
本栏最新