英伟达芯片倒爷快玩不动了
时间: 2024-04-12 07:35:23 | 作者: 奥运案例
在不为人可知的特殊渠道里,英伟达芯片生意一度风生水起。在这一波囤积的算力释放之后,倒爷们会逐渐沉寂,最终大多数都会消失
3月30日,美国升级对华芯片出口禁令,表示将对中国出口的AI半导体产品采取“逐案审查”政策规则,全面限制英伟达、AMD以及更多更先进AI芯片与半导体设备向中国销售。
这一举动实质影响有限——在2022年和2023年,美国已经两度收紧对华AI芯片出口。产业界普遍对出口的口子被重新扩大不抱幻想。从2022年下半年开始,中国公司就开始疯狂抢购英伟达等AI芯片,一张GPU售价一度飙涨至接近40万元。
一个被普遍接受的观点是,在国产芯片能够逐渐替换英伟达之前,仍旧有至少三五年的过渡期。拥有足够多的英伟达芯片,目前暂时是大多数中国公司参与新一轮AI竞争的生命线。
这也催生了一个特殊职业:倒卖英伟达芯片。传闻里,这生意一本万利,倒爷们神通广大,赚得盆满钵满。果真如此吗?
我们试图讲述一位掮客在此间经历的疯狂、欲望和欺骗。人类历史上下一场科技革命最重要的燃料,世界上最稀缺的算力资源,如何在无数隐蔽的小黑屋和推销电话里,被决定了流向——这正是阿诚的故事的特别之处。
他曾是一个普通的英语老师。2023年9月,阿诚入职深圳一家卖英伟达芯片的分销公司。做的第一件事,是给自己整了一套全新的名片。即使那时他身上已经装了六七种不同身份的名片,随便什么时间都能对不同的人展开不同的说辞,但没有哪个身份比这张名片上的头衔更让他觉得有面子了——新纪元科技有限公司中国区销售总负责人。
只要他不说,没有外人会猜到,包括总负责人在内这公司只有两个销售——阿诚是其中一个,再加上老板、财务、售后,他们就开始搞事了。
在绝对的产品力面前,任何销售技巧都是多余的。在一个500人的芯片大群里,我只加了诚哥一个人,因为他的群昵称太有诱惑力了:诚哥H800。
H800,英伟达中国的一款数据中心GPU,也是2023年大模型算力竞赛里中国公司能合法买到的最先进的GPU。当下,英伟达就是训练大模型所需算力的最优解。全世界都在抢购。有人说,大模型的风吹了一年多,只有两拨人赚到了钱:一拨人卖AI课、一拨人炒英伟达芯片。
2023年10月,美国宣布扩大对华芯片管制,H800等四款产品也被要求禁运。当天,英伟达中国的A800和H800芯片停止接单。接下来,价格是按小时涨的,短短一周内,单张H800卡的报价几乎从20万元人民币翻了一番。一台H800服务器在10月初的服务器售价为220万元,到了10月底已经飙涨到300万元。
半年后,在深圳南山附近的一家咖啡店里,诚哥问我,“你猜我们五个人,一个月卖了多少钱?”
“5——个——亿哦。”许是很满意我已经惊讶到接不上话,他主动吐露了答案。我看着这个西装下穿着运动鞋、风尘仆仆的80后男人,他看起来真诚、老实,微微含着肚腩,给人一种腼腆的感觉,只有瞳孔因为兴奋而明显放大——我突然相信了,他刚才告诉我他老板说他炒芯片时的状态——“阿诚啊,你一炒芯片就眼睛发光,肯定是要发大财哇。”
那时他在英语教培机构工作,别说大财了,想在深圳买房要攒钱到下辈子。他不甘心。2021年7月。双减政策一出,阿诚是机构里第一个跑路的人。
一个没了工作的35岁男人,在不少地方要被归类为中年loser(失败者)。但是深圳有自己独特的造富生态,单车变摩托的故事俯拾皆是。在阿诚看来,早年卖山寨机,“互联网+”兴起时玩地推,等到比特币行情起来了再用显卡挖矿,发币割韭菜的,很可能就是同一拨人。
当时,这个风口是“炒芯片”。既然是炒,就说明有套利的空间。疫情后缺芯危机愈演愈烈,珠三角活跃着上万个芯片黄牛,一些公司一个月就可以招聘100个芯片销售。阿诚折腾起了芯片。在外人看来。从英语老师转行卖芯片实在是匪夷所思,但是在诚哥的口中,这个难度并不存在,“公司招人时,对我发了个面试邀请,我就过来了”。
他认为,高杠杆的事情才有得赚。倒卖信息差就是杠杆最高的赚钱方式。越是风口上的行业,信息差越高,杠杆越高。如果在风口上,自身能力的参差似乎并不重要。
诚哥其实也不知道,他能做的,就是跑动得勤快一些。短短一年不到,他加了几百个行业群,跑了几百场会,换了几百张名片,他的身上有一种深圳式的搞钱执着。即使千里迢迢跑到外地去参会他也很少觉得辛苦。
珠三角成为中国电子信息产业集聚地已经快40年,近些年一个越来越明显的变化是,国际局势任何风吹草动,都可能改变这里一群人的生计。
2022年底,大模型开始席卷科技圈。诚哥发现,有一个词高频地出现在圈子中。这些人无论原来是在挖矿、玩NFT、搞元宇宙,现在,他们有了一个新的财富密码:H100。
H100,英伟达这一轮市场行情的起点。如果说英伟达当下是训练大模型所需算力的最优解,H100就是最优解中的明珠。
大模型的竞争会被称为算力军备竞赛,是因为大模型本质上更是一种大力出奇迹的暴力美学,换句话说,想要获得更强大的模型效果,就得靠堆卡,堆更多、更强大的卡。
供需极度失衡。行业媒体GPU Utils曾经做过一个测算,H100一年的出货量大约也只有55万张。但是,仅美国大型科技公司和少数几家明星初创公司,对H100的需求量一年内就达到了43万张。对Meta之类的巨头公司来说,囤上10万张H100在商业竞争中才有先机。而对初创企业来说,没有1万张H100,连坐上牌桌的资格都没有。
中国也差不多的情况,但中国公司的需求被美国政府的出口限制强行摁住。2022年10月,美国对华启动芯片管制。几乎是在H100和比其性能稍弱的A100被禁运的同一时间,OpenAI发布了chatGPT,从那时起,有多少张英伟达卡,成了中国科技公司AI实力的一把标尺。几乎所有选择宣布加码大模型的互联网大公司,在财报会上一定会被问的一个问题是,公司储备了多少英伟达卡?
第一拨行动者出现了。在2022年夏天之前,原价18万多元人民币的H100在中国需求量并不惊人,性价比低点的A100甚至有些滞销。然而,芯片禁令后市场上不多的存货就像被蝗虫过境,一扫而空。
四个月后,中国的大模型业进入了“百模大战”时间,英伟达面向中国客户推出H800,这个版本被俗称为H100的“版”,英伟达在这个版本里去掉了受美国政府那一轮禁令管制的参数。加上此前已经推出的A100低配版A800,英伟达的中国客户还算有卡可用。抢卡的竞争又来到了一个新赛点。
至少有五类角色在疯狂抢购:电信运营商、服务器大厂、互联网和AI公司,以及业务和算力无关但是现金流充沛的大企业。
英伟达芯片在中国市场有四种渠道流通。其中两种可以订购中国版的官方渠道:一条通过英伟达自己的经销商体系,一条通过英伟达认证过的服务器大厂经销商体系,这两条渠道上挤满了排队下单的大厂,交付的时间则取决于英伟达,最快也要到2023年底。为了插队,大厂高管们八仙过海式的拉关系,甚至不乏上市公司老板直接飞去美国见英伟达CEO(首席执行官)黄仁勋。
另外两种渠道则通过黄牛,这个渠道多少有点暗箱操作:一类有海外背景,可以有特殊的海外渠道让H100/A100流入内地;另一类则是体量更小的散户,他们的货源来自内地,“至于具体是哪里,那就要看各自的本事了”。
“一卡难求”的情况甚至还推高了国产芯片的市场空间。诚哥一开始没有渠道,卖不了英伟达芯片。他花了四个多月,帮一家号称“中国英伟达”的国产AI芯片公司成交了一笔200多万元的合同。
诚哥认为,之所以说好的佣金也不给他,是因为这公司自己处境艰难。他的依据很简单,市场上愿意买英伟达之外芯片的厂商寥寥,“客户买英伟达的卡是拼手速,秒慢没;买这公司的卡要磨磨蹭蹭,讨价还价”。即便卖出去了,客户的目的仅仅是为了符合国产芯片需占特殊的比例的采购要求,买了卡也通常是堆在库房。
此时,对在2023年向英伟达下订单的大多数中国公司来说,H800遥遥无期,A800是唯一到货的产品。这一产品刚推出时售价为7.4万元,到了6月底,黄牛开出的高配版的售价逼近10万元,而到了7月下旬,价格已超过12万元。无论是出于抬高价格还是恐慌心理,市场在疯传,美国将要再次收紧芯片管制。
入局者也慢慢变得多了。如果说一年前的夏天,大量囤英伟达卡的公司必定业务和其有相关,现在也可能是一个卖味精的公司或者是一家女装公司。囤卡的散户也从过去长期依赖英伟达显卡挖矿的大佬,变成了现在可能是任何一个毫无背景的人。
诚哥就是当时入局的——新纪元此公司当时成立才一个月,但有“渠道”。
从外表上看,新纪元实在是不够新。在大厂林立的深圳南山,这里着实太简陋了:两间屋子,五把椅子,还有一些电脑和手机,就是全部家当。
诚哥一进去就发现了这是个草台班子。虽然他之前只短暂卖过四个月国产AI芯片,但他已经是公司里经验最丰富的人。老板是个快60岁的湖,年纪不小,看起来却很有一股疯劲。他对阿诚直言不讳,招他来,是因为他有些经验但是又不多,“太会的人拿捏不住”。
被寄予厚望的诚哥获得了使用单独办公室的权利。不是因为他资深,而是他不喜欢和同事们在一起打电话。
这种古老的营销手段,在这个新圈子里却有用。诚哥和同事们获客的方式是先在网上找到哪里出现了招投标的消息,再找到消息中参与公司的联系方式,直接打过去。
诚哥有一个观察,人们对陌生电话常充满警惕,但是对推销英伟达的陌生电话格外宽容。在听完他说“你好,我是卖英伟达卡的”之后,几乎所有人都会愿意聊下去。无论对方是一家上市公司AI业务总监,或是某个大型实验室采购负责人,通常对话不有必要进行十句,双方加微信,诚哥便会把报价和合同推过去。
在一个绝对的卖方市场里,有了货源就从另一方面代表着有了权力。在中国,英伟达的两种官方渠道一类是原厂—总代理—经销商—市场;另一类是原厂—服务器大厂—经销商—市场。
看起来,每种渠道只有四类角色,是一个组织严密的金字塔状;但事实是由于市场过热,这两个结构已经被冲击成网格式的蜂巢状了——换句话说,每一类角色的背后,都可能分化出无数二道贩子,交易也不再是逐级流通。
诚哥的公司就是这样游离在第二种边缘。“我们老板与服务器大厂那边有些关系,能搞到卡。但我们没大厂正规经销商的资质,充其量只能说是游击队。”不过,即使是游击队在当时也拥有了不一般的地位。诚哥说,他见客户从来都是“让客户过来”,和客户吃饭时“他们对能搞到货的人佩服得五体投地”。
如今,阿诚回想起来那段日子,能想到的形容词只有一个,“疯狂,太疯狂了”。10月17日,美国扩大对华芯片管制范围,英伟达在中国市场流通的所有AI芯片均被列入其中。
这份管制原定有30天公示期。这段时间也因此被行业人士视为“最后30天窗口期”。理论上说,最后30天,英伟达等企业会把所有先进AI芯片产能、库存都优先供给中国市场。这会是中国企业抢购英伟达芯片最后的“操作窗口”。
此时,H800单卡市场价已经飙升至21万元一张左右。很快,新纪元公司就成交了一笔4亿元的合同。还没有来得及庆祝,就又签下了一个1亿多元的单。
我在禁令出台当天和他通了一个电话,那时他刚刚接完一个十几亿元的订单垂询,声音嘶哑,但是是破音的那种兴奋。接下来,他的电话就再也没有打通过——他太忙了。过去对他发消息从来不回的大厂高管,为了买卡一天发十几条消息。一家公司问他们能搞到多少张,“280万元以下的H800服务器有多少台我们都收”。诚哥在那几天几乎疯狂,不需要吃饭,也不会疲劳,只要在呼吸,就可以卖卡。他根本就没有考虑过有没有货源能交付。
他闭上眼睛,想睡一会,脑海里又响起来狂躁的询问声,“有卡吗!有卡吗!有卡吗!买卡吗!买卡吗!买卡吗!”
人类历史上下一场科技革命最重要的燃料,世界上最稀缺的算力资源,就这样在这些隐蔽的小黑屋和电话里,被决定了流向。
10月25日,美国宣布禁令立刻生效,30天窗口期以一种戏剧性的方式被掐断。不久之后,和上次在英语培训机构一样,他先跑路了。
原因很简单。那些天价订单生意,随着交付日期的临近,他太担心老板要卷款跑路了。这担心始终存在于公司所有人的心里。空手套白狼的例子太多了——假设A公司什么也没有,也可以和B先谈妥一笔供应合同,A再去找C拿货,C的货可能也是从D或者E处加价买来,中间A发现F的开价比B要高,于是此前的一切白纸黑字都可以作废。
有多少合同能够落地?就像那笔4亿元的订单,货物从签单到完成交付中间隔了12周的时间,市场价涨了100多万元,而毁约只需要成单价1%的罚金,他很怀疑,老板不会选择交付。
诚哥也不知道。他告诉我,自始至终,他没有见到那批货,就像他也没有见到那笔钱一样。
更重要的是,诚哥猛地发现,90%的倒爷赚不到大钱,这让我意外。他给我算了一笔账,假设一台H100八卡服务器出厂价250万元,终端市场价280万元,中间看起来有30万元的差价,但是很可能倒了十次不止,一家只能赚3万元。这些利润大部分被掌握货源的老板吞掉,他作为打工人,抽成是利润的3%。
因此,这生意只有掌握货源的人才能赚到钱。他有一个切身感受,这两年来各家疯抢GPU的力度远超于了真实需求,更类似于市场对美国随时有可能加码的芯片制裁的本能反应——只要科技竞争的阴影存在,高端AI芯片必然是期货。不少公司是在以此为投资。甚至可以说,找散户下单的公司,将来相当一部分还会选择再把芯片卖出去。
归根结底,二道贩子这么多,是因为货源太稀缺了。“无论芯片通过什么方式进入国内,就像水流一样,封锁当然不可能完全封锁,但已经足够锁住大部分的水流了。”阿诚说。
事实是,所有的疯狂都是徒劳。在2023年10月17日芯片禁令之后,合法渠道到货的H800寥寥无几。
财报显示,2023年第三财季,英伟达中国大陆收入高达40.3亿美元,环比大涨47%。出口管制规则出台后,2023年第四财季英伟达中国大陆收入仅为19.5亿美元,环比大降52%。当季,中国大陆仅占英伟达总营收的8.8%,是历史最低点。
英伟达和AI相关的数据中心业务在中国大陆的收入占比过去长期达到20%-25%。但自2023年10月起,该收入显著减少。英伟达高层表示,2023年第四财季,中国大陆在数据中心收入中的比例已降至个位数,预计下个财季也将保持这一水平。
2024年,英伟达将会推出H200等四款革命性AI计算产品。同时,根据瑞银近期的研究,其交付时间在缩短,已经从2023年末的8个至11个月缩短了一半时间。一些机构预测称,英伟达在今年将销售大约150万到200万个AI GPU,数量是2023年3倍。
2024年3月18日,美国圣何塞,英伟达CEO黄仁勋在英伟达年度技术峰会GTC 2024大会上发表主题演讲 图/IC
看起来,这些与中国无关了。但是,这里有一个连锁反应在后,英伟达在全世界内供应能力的增长将会给中国公司能够带来更大的竞争压力。随着全球AI应用水平因GPU供应的大量增加而快速提升,中国必须寻找替代方案来应对。
目前,通过官方渠道购买H/A800和H/A100已经不可能。黄牛之间流通的芯片价格略有回落,但依旧令人咋舌。离开新纪元以后,阿诚自己开了一个企业,刚刚给客户报了价,一台搭载八个H800的AI服务器价格还是约300万元。好在一些此前被囤积的芯片正在被释放,市场上现货充足,一般两周以内就能交付。
因为生意不稳定,他还同时在另一家英伟达代理商那里上着班。即使AI芯片受限,他还是坚定看好英伟达包括游戏显卡和无人驾驶在内别的业务在中国的前景。
这块市场英伟达无法放弃。在芯片禁令不久之后,英伟达再次针对中国市场推出了三款在数据传输速度等关键性能上逐步降低的芯片:H20、L20和L2。市场上传言,这些芯片性价比太低,并不受中国公司青睐。中国公司更愿意采购国产新品。
阿诚对这种传闻嗤之以鼻。“那些只是外界的一厢情愿”。具备推理能力的L20最先面世,但是迅速被几家互联网大公司抢购一空,没多少能流入到市场上。而适用于大模型训练的H20也不是中国公司不想买,而是买不到。H20在今年1月开始接受预订,但仅限大客户。
这反而激发了部分公司对特殊途径的需求。无论是将芯片通过非禁运国家以转运的方式进入中国市场,还是考虑把数据中心业务建在海外,在业内人看来,即使审查的手段越来越严。愿意冒险的公司数量仍在明显变多。
3月30日凌晨,美国商务部宣布了一项新的出口管制规定,对涉及美国和中国澳门等地区的对华半导体产品营销售卖限制进行了调整,同时,美国对华出口的AI半导体产品将实施“逐案审查”政策,对技术等级、客户身份、合规计划等做全面审查。也就是说,新规进一步限制英伟达、AMD以及其他先进AI芯片与半导体设备对中国的销售。
这在意料之中。阿诚告诉我,这些变化在短期内影响不大。新规主要限制AI芯片未来流入中国的可能,但是中国市场在此前囤积的芯片已经足够很长一段时间供需。他注意到,交付周期在明显缩短。之前一些在疯狂抢卡的公司,现在慢慢的开始卖卡和做算力租赁了。过去倒爷们只需要强调“有卡,速来”,现在还要强调“量大,可持续供应”。
不过,能预见,在这一波囤积的算力释放之后,倒爷们会逐渐沉寂,也许最终大多数都会消失。“中国区需求量的高峰期是在去年三季度。炒货的高峰期是在去年四季度,但是需求量已经在减少了。”他认为,中国公司对英伟达的需求已经过了抛物线的高点。接下来,英伟达在中国的发展重点不是是否衰退,而是衰退的曲线如何变化。
技术的领先是有时间期限的。对中国公司来说,如果无法购买更先进的英伟达产品,现有存货的优势终将跟着时间变化而减少。他听说了一些关于国产AI芯片如今供不应求的故事——情况和去年这时已经大不同了。他对华为芯片很感兴趣,有机会的话也想卖。
不过眼下,阿诚还得先做好英伟达,年前他刚刚成交一单700万元的生意。“一切都会慢慢的变好的。”他充满信心,因为现在的圈子多得是企业中高层和行业大人物。
他向我谈起一个关系紧密的中间人,告诉我对方“是某某亚太AI协会的领导,协会里有100多位院士”。他说,之前对方帮他介绍过1笔500台以上的大订单,如果成了,他要付给对方一台3万元的中介费,也就是对方至少可以赚1500万元。
“可惜没有成。”我看着他一脸真诚的遗憾,有些常识不确定他知不知道,中国大陆并不允许公司注册名以亚太开头——所以我一看到以亚太为名的机构,很难不联想到注册在中国香港的皮包公司。