“時間機器”
狂歡的氣氛早早燃起。
當?shù)貢r間2023年8月22日,2024財年第二財季財報發(fā)布前夕,英偉達的股價飆升8.47%,創(chuàng)下自5月25日以來的最大單日漲幅。據(jù)芝加哥期權(quán)交易所的數(shù)據(jù),2023年截至8月中旬,投資者已向英偉達相關(guān)期權(quán)注入超1000億美元,其中約60%的資金涉及可用于押注股價持續(xù)走高的看漲期權(quán)。除特斯拉外,還沒有其他股票曾收獲如此熱捧。
投資者的狂熱沒有踏空。8月23日發(fā)布的財報顯示,英偉達期內(nèi)實現(xiàn)收入135.1億美元,同比上漲101%,高于預期的111.9億美元;凈利潤61.9億美元,同比上漲843%;非美國通用會計準則(non-GAAP)每股攤薄收益為2.70美元,同比上漲429%,高于預期的2.08美元。
分業(yè)務(wù)來看,AI芯片所在的數(shù)據(jù)中心業(yè)務(wù)貢獻突出。2024財年第二財季,數(shù)據(jù)中心業(yè)務(wù)營收達到創(chuàng)紀錄的103.2億美元,環(huán)比增長141%,同比增長171%。相比分析師預期的79.8億美元高出了29%。英偉達表示,這部分收入主要來自云服務(wù)商和大型消費類互聯(lián)網(wǎng)公司。
“全球已經(jīng)安裝了價值約1萬億美元的數(shù)據(jù)中心,而這個上萬億美元的數(shù)據(jù)中心市場正在從通用計算向加速計算和生成式人工智能轉(zhuǎn)型,” 60歲的英偉達聯(lián)合創(chuàng)始人兼CEO黃仁勛在財報電話會議上宣稱,“一個新的計算時代已經(jīng)開啟?!?/p>
2023年5月底,上一財季財報發(fā)布后,高漲的股價已將英偉達推上神壇,使其成為美國第七家市值破萬億美元的公司。3個月后,它再度刷新紀錄且增勢不減。作為這輪生成式人工智能浪潮中重要的基建公司,英偉達正在成為這個“新時代”的主要受益者和推動者。
時間回到大半個月前。8月8日晚,洛杉磯,穿著標志性的黑色皮夾克、黑色T恤、黑色牛仔褲,黃仁勛時隔5年再度登上計算機圖形界頂級會議SIGGRAPH的舞臺,宣布推出新一代GH200 Grace Hopper超級芯片(以下簡稱GH200)。
與2022年3月發(fā)布的H100相比,GH200專為人工智能大模型的訓練和推理需求而打造。H100的架構(gòu)以GPU(圖形處理器)為主,GH200則將Nvidia Grace CPU(中央處理器)與 Hopper GPU 架構(gòu)結(jié)合起來,并配備了當前全球最快的內(nèi)存HBM3E,不僅極大提升了帶寬,還顯著降低了互連功耗,將為運行TB級數(shù)據(jù)應用提供高達10倍的性能。
據(jù)悉,已投入量產(chǎn)的GH200將于本季度發(fā)貨,采用HBM3e內(nèi)存的第二代版本預計將于2024年第二季度發(fā)貨。在此之前,H100仍是市場需求最大的GPU產(chǎn)品。雖然老牌芯片巨頭AMD和英特爾接連加碼AI芯片,陸續(xù)推出對標H100的產(chǎn)品,但當前英偉達在AI芯片領(lǐng)域的市場份額仍超過八成。
三十年前,因為看到游戲市場對3D圖形處理能力的需求,黃仁勛和其他兩位合伙人共同創(chuàng)建了英偉達。創(chuàng)立初期,公司的主要營收是向游戲玩家出售能提升畫面清晰度的顯卡。2003年,英偉達開始對傳統(tǒng)GPU進行優(yōu)化設(shè)計,旨在利用GPU的計算能力在非圖形處理領(lǐng)域進行更通用的科學計算。一場更廣泛的創(chuàng)新革命的齒輪由此開始轉(zhuǎn)動。
黃仁勛將深度學習和GPU的相遇形容為“命運撞上了一點運氣”,“創(chuàng)立英偉達是因為我們相信人類對計算速度的要求會越來越高。我們開發(fā)了一種非常擅長處理數(shù)據(jù)且有高通量計算能力的處理器,這恰恰使深度學習成為可能?!?/p>
2016年4月,英偉達發(fā)布了首款深度學習超級計算機DGX-1,其中搭載了8塊專為深度神經(jīng)網(wǎng)絡(luò)打造的GPU產(chǎn)品P100。4個月后,黃仁勛親自將一臺DGX-1送往舊金山一家成立不足一年的非營利性人工智能研究機構(gòu)。捐贈儀式上,他用記號筆在這款售價12.9萬美元的機箱上寫道,“為了計算和人類的未來,我捐出世界上第一臺DGX-1?!边@家受贈機構(gòu)就是日后赫赫有名的OpenAI。正是基于 NVIDIA DGX 系統(tǒng),OpenAI訓練出了ChatGPT。
算力是機器學習得以不斷突破極限的基礎(chǔ)。據(jù)黃仁勛介紹,在2021年推出的A100上需要7天完成的訓練,在H100上僅需20個小時。隨著英偉達GPU在運算性能和能效上的逐代提升,以此為算力支撐的大模型得以在參數(shù)上實現(xiàn)質(zhì)的飛躍。公開數(shù)據(jù)顯示,OpenAI于2018年推出的GPT參數(shù)為1.17億個,而到2023年發(fā)布的GPT-3.5,參數(shù)規(guī)模已超過1750億個。
黃仁勛喜歡把GPU比作“時間機器”,“如果我們能讓某件事加速100倍,研究人員、醫(yī)生和藝術(shù)家就能看到未來”,“幫助這個時代的愛因斯坦和達芬奇?zhèn)兺瓿伤麄兊氖聵I(yè)就是我們公司的價值?!?/p>
“軍備競賽”
通用性、易用性和高性能是衡量AI芯片好壞的三個維度。英偉達能成為行業(yè)在AI算力上的首選,其護城河既體現(xiàn)在硬件性能,也在軟件生態(tài)。
黃仁勛很早就意識到協(xié)同完善的軟硬件生態(tài)是創(chuàng)造價值及壓制對手的關(guān)鍵。2006年,為了推廣GPU通用計算,英偉達開發(fā)了用于加速并行計算的軟件開發(fā)平臺CUDA,CUDA可以幫助開發(fā)人員更便捷地利用GPU加快計算應用程序的速度。
CUDA平臺投入巨大,一度嚴重拖累了英偉達的利潤。最初的幾年里,黃仁勛背負了很大的壓力,“股東希望我們專注于提高盈利能力,但我們堅信加速計算的時代即將來臨?!秉S仁勛將承受苦難視作追求愿景路上的必經(jīng)之痛。
十幾年來,CUDA逐漸滲透到包括AI在內(nèi)的各個通用計算領(lǐng)域,實現(xiàn)了從硬件層到軟件層的打通,且基于海量客戶,不斷實現(xiàn)性能優(yōu)化。如今,英偉達的軟硬件生態(tài)已經(jīng)形成“比較成熟的市場、標準和護城河”。競品要打開市場,短期內(nèi)只能兼容CUDA生態(tài),長期則很可能因此而被限制創(chuàng)新潛能,淪為夯實CUDA生態(tài)的磚瓦。
2022年底,ChatGPT展現(xiàn)出的強大內(nèi)容生成能力震驚全球,成為現(xiàn)象級的消費類AI應用。科技巨頭應勢而動,爭相布局大模型領(lǐng)域,其示范效應引發(fā)了AI領(lǐng)域的軍備競賽。生成式人工智能的繁榮建立在算力基礎(chǔ)上,訓練大模型無疑是昂貴的,特別是在供不應求的狀況下。據(jù)硅谷風投巨頭a16z測算,一家企業(yè)若要構(gòu)建并運行自己的數(shù)據(jù)中心,每年需要花費在基礎(chǔ)設(shè)施上的支出將超過5000萬美元。一些大模型初創(chuàng)公司前腳籌集了數(shù)十億美元的風險投資,其中的八九成轉(zhuǎn)身便被投入購買算力。
錯失大機會的恐懼讓算力成為科技圈的“最硬通貨”。市場對英偉達芯片的需求激增,遠遠超過了供應。“H100的供應自2023年4月初起便日益緊張,哪怕現(xiàn)在立刻下單,到貨也要等到來年一二季度,” CoreWeave負責人8月初在接受《巴倫科技》采訪時表示。CoreWeave此前的主要業(yè)務(wù)是加密貨幣挖礦,如今面向市場提供GPU租賃服務(wù)。
就連最初掀起這波熱潮的公司OpenAI也無法獲得足量的英偉達高性能GPU。2023年5月,在參加美國參議院司法委員會聽證會時,OpenAI CEO薩姆·奧特曼就表示并不希望人們過多地使用ChatGPT,因為“我們沒有足夠的GPU”,這也影響了ChatGPT的持續(xù)優(yōu)化。
芯片行業(yè)是個由一系列瓶頸構(gòu)成的相互依存的網(wǎng)絡(luò)。英偉達的主營業(yè)務(wù)是設(shè)計和銷售圖形處理器和系統(tǒng)芯片,并提供開發(fā)環(huán)境、工具和系統(tǒng)。以H100為例,其中使用到的高帶寬內(nèi)存(HBM)由韓國企業(yè)SK海力士供應,后者是目前唯一量產(chǎn)HBM3的供應商。H100的制造則被委托給臺積電。除了HBM3供應吃緊,臺積電的CoWoS封裝產(chǎn)能同樣是關(guān)鍵瓶頸。據(jù)悉,臺積電正在積極擴大CoWoS封裝產(chǎn)能,其2024年產(chǎn)能的四成已被英偉達提前預訂。
除硅谷巨頭外,中國的大型互聯(lián)網(wǎng)企業(yè)是AI芯片的另一大去向。據(jù)英國《金融時報》8月初的報道,中國互聯(lián)網(wǎng)巨頭今明兩年AI芯片的訂單價值達50億美元。針對這一數(shù)據(jù),英偉達向第一財經(jīng)回應稱:“消費互聯(lián)網(wǎng)公司和云服務(wù)提供商每年在數(shù)據(jù)中心組件方面投入金額達數(shù)十億美元,通常都會提前幾個月下訂單?!?/p>
“過去兩年的降本增效中,一些云計算平臺減少了GPU采購,儲備不足。此外,誰也不敢保證,今天能買的高性能 GPU,明天會不會就受到新的限制?!?023年6月,一位業(yè)內(nèi)人士在接受《晚點 LatePost》采訪時表示。
2022年8月,美國商務(wù)部對英偉達的最新兩代GPU A100和H100實施出口管制,禁止向中國企業(yè)銷售。同年10月,美國商務(wù)部正式出臺了針對中國大陸的半導體出口管制新規(guī),對先進芯片、軟件以及用于生產(chǎn)先進芯片的各種半導體制造設(shè)備的對華出口提出了許可限制。
英偉達數(shù)據(jù)中心業(yè)務(wù)收入的20%至25%來自中國市場。為了降低政策影響,英偉達迅速推出了A100的替代產(chǎn)品A800和H800。根據(jù)公開資料,特供版的單卡算力幾乎不變,但集群卡間高速互聯(lián)的帶寬分別下降了四分之一和一半左右,會限制AI模型的訓練速度。按照彭博社的說法,同樣的 AI 任務(wù),H800要比H100多耗費10%到30%的時間。
《華爾街日報》6月底曾援引知情人士消息稱,美國正在考慮對向中國出口人工智能芯片實施新的限制,將禁止在沒有許可證的情況下對華銷售A800芯片,并將一些低算力芯片納入限制范圍。包括英偉達在內(nèi)的美國半導體行業(yè)曾多次就政府的對華限制政策發(fā)聲?!爸袊袌鍪侨蜃畲蟮氖袌鲋弧R坏〨PU禁售政策實施,美國半導體行業(yè)將永久失去在這里競爭和領(lǐng)先的機會?!庇ミ_首席財務(wù)官科萊特·克雷斯在最近的財報電話會議上表示。
“數(shù)據(jù)、算法、算力是人工智能的三大核心要素。中國擁有海量數(shù)據(jù),近年在算法上突飛猛進,美國卡不了這兩塊,就卡算力。算法是基于算力的,把算力卡下來,算法就難以進一步優(yōu)化,數(shù)據(jù)再多也沒用?!币幻煜ぶ忻腊雽w政策的資深人士在接受《財新》采訪時表示。
在管控可能持續(xù)加碼的陰霾下,半導體芯片國產(chǎn)替代的需求凸顯。雖然在通用GPU賽道上,過去數(shù)年國內(nèi)也陸續(xù)涌現(xiàn)出一批初創(chuàng)企業(yè),但在產(chǎn)品的成熟度和性價比、商業(yè)化的驗證和落地、客戶基礎(chǔ)和軟件生態(tài)等方面,這些企業(yè)仍與英偉達差距明顯。
在《芯片戰(zhàn)爭》的作者、美國塔夫茨大學副教授克里斯·米勒看來,雖然中國企業(yè)取得了一些有意義的成功,但幾乎每一項重大進步都會遭到美國新的出口管制,“這使得中國推動半導體自給自足的努力更加重要,但也更加困難和昂貴。”
神話與變數(shù)
2017年,創(chuàng)業(yè)第24個年頭,為慶祝股價突破百元,黃仁勛在左臂文上了公司的標志“綠眼睛”。此后的5年間,英偉達的股價從每股100美元飆升至超490美元。2023年以來,英偉達的股價已上漲兩倍多,持股3.5%的黃仁勛也成為全球科技行業(yè)財富增長最快的人之一。
1963年,黃仁勛出生在臺北。他的父親是化學工程師,母親在小學任教。70年代初,臺灣時局動蕩,一家人遷往泰國。然而,越南戰(zhàn)事正酣,泰國亦被牽涉其中。1973年,泰國爆發(fā)騷亂,考慮到孩子們的未來,黃父設(shè)法把9歲的黃仁勛和大他一歲的哥哥送到美國投奔叔叔。
叔叔英文不好,誤讀了招生信息,將本應去預科學校的兄弟倆送到了肯塔基州一所專門接收問題青少年的寄宿學校。據(jù)黃仁勛回憶,學生們大多會隨身攜帶小刀,一旦發(fā)生沖突,總會有人受傷。他的室友剛從少管所出來,是個身上帶著刀疤的男孩。放學后,孩子們會被分配各種工作,黃仁勛需要打掃男廁所,他的哥哥則要趕往煙草農(nóng)場干活。
年少的黃仁勛沒有因此頹靡,而是找到了適合自己的生存之道。他會幫助一位年長的室友學習數(shù)學,還加入了學校的游泳隊?!肮适碌慕Y(jié)局是我喜歡在那里的時光,這是一段美妙的學習經(jīng)歷,”黃仁勛學會了如何面對不可控的外部環(huán)境,并找到在混亂中前行的方法。
在俄勒岡州立大學學習電氣工程專業(yè)期間,為了改變內(nèi)向的性格,黃仁勛在一家名叫“Denny's”的連鎖餐廳做兼職服務(wù)員。這家餐廳不僅見證了一位金牌銷售員的誕生。1993年,黃仁勛30歲生日那天,也是在這家餐廳的一張餐桌上,他和兩位好友決定離職創(chuàng)業(yè)。從斯坦福大學碩士畢業(yè)后,黃仁勛先后在AMD、LSI Logic工作。工程師出身又有銷售和管理經(jīng)驗的黃仁勛被推選為CEO。30年后,他成為全球任職時間最長的科技公司CEO之一。
在黃仁勛看來,創(chuàng)業(yè)和人生一樣,是“榮耀”和“悲劇”的永恒交替,成功的關(guān)鍵是當事情沒有按預期發(fā)展時,你是否能正視錯誤、及時糾錯、謙卑求助并持續(xù)向前。
20世紀90年代,創(chuàng)立不久的英偉達因為開發(fā)方向偏離市場主流,不得不更換技術(shù)路徑。然而競爭對手的產(chǎn)品發(fā)布在即,他們必須在數(shù)月之內(nèi)拿出足夠有競爭力的新產(chǎn)品。從合作方處力爭來的資金僅夠支撐9個月。為確保芯片的所有功能在投產(chǎn)前萬無一失,黃仁勛斥資100萬美元買下一臺模擬機,用“公司3個月的壽命”換來了反復測試的機會。RIVA 128最終順利面世,這是一款專門用于在windows操作系統(tǒng)中渲染3D圖形的軟件。破釜沉舟的黃仁勛贏得了一次扭轉(zhuǎn)公司命運的機會。
然而變數(shù)再度襲來。微軟發(fā)布的游戲編程接口DirectX可支持32種圖形渲染模式,而RIVA 128只能提供其中的8種。黃仁勛和團隊跑遍了全球的主要游戲開發(fā)商,輪番游說,“你喜歡RIVA128的很多優(yōu)點,所以沒其他的24種模式也還好吧。你要是用了它們,我們就死定了?!边@是一場艱難的勝利。發(fā)布后的4個月,RIVA 128的出貨量超過百萬臺,成為英偉達的首款熱門產(chǎn)品,也為其后續(xù)的產(chǎn)品開發(fā)提供了資金。
2020年,英偉達首次在市值上實現(xiàn)對英特爾的超越,成為美國市值最高的芯片廠商。在接受媒體采訪時,被祝賀聲環(huán)繞的黃仁勛描述著自己從未遠離的危機感,“每天早上我都在驚慌中醒來,我有很多工作要做,我有一家公司需要拯救。我們有很多合作伙伴和企業(yè),我們不想讓他們失望。那種感覺永遠不會消失?!?/p>
對于“增長神話”的源起和消散,黃仁勛并不陌生。
2017年比特幣暴漲引發(fā)“挖礦”狂潮,帶動顯卡銷量和價格大幅上揚。彼時,在數(shù)字貨幣市場搶占了超七成份額的英偉達市值同樣屢創(chuàng)新高??蓛H僅一年后,加密貨幣的幣值便經(jīng)歷數(shù)輪崩塌。不僅與區(qū)塊鏈相關(guān)的GPU收入同比大幅下降,大量二手顯卡也回流市場,進一步影響了游戲玩家對庫存GPU的需求,一度導致英偉達的市值在4個月內(nèi)遭遇“腰斬”。
2021年,“元宇宙”概念興起,又逢加密貨幣幣值回彈,英偉達股價在當年11月創(chuàng)下歷史新高。這輪上漲同樣未能延續(xù)太久。一年后,“元宇宙”發(fā)展陷入困境,加密貨幣的行情再度跳水,英偉達的股價于2022年10月跌至歷史新低,同比跌幅近70%。次月,ChatGPT發(fā)布,英偉達股價開始掉頭拉漲,增長神話開啟新的篇章。
這輪人工智能熱潮會持續(xù)到明年么?并非所有分析師都持樂觀態(tài)度。部分觀點認為,為了規(guī)避錯失良機的風險,很多企業(yè)和機構(gòu)會對GPU進行過度投資,然而越過某個時點,他們終究需要謹慎評估如此昂貴的投入是否真的能幫他們賺到錢,而后過度投資之勢便會暫停甚至逆轉(zhuǎn)。此外,為了減少對英偉達的依賴,提高議價能力,大型云服務(wù)商等已經(jīng)開始在內(nèi)部積極推進定制AI芯片的研發(fā)。大客戶們的下場也讓這個原本就競爭激烈的賽道更為擁擠。
科技的潮頭總是一波接一波,層波疊浪間翻滾著人類的好奇、欲望與盲從,裹挾著技術(shù)和經(jīng)濟的周期更迭,以及地緣政治的云譎波詭。作為“在淘金潮里賣鏟子的人”,如何創(chuàng)造、選擇和駕乘海浪,是不變的課題。而對于黃仁勛來說,企業(yè)經(jīng)營理念和人生態(tài)度極其相似,“當你無法分辨自己是在尋找食物還是逃避成為食物時,奔跑就好了?!?/p>