
中國人工智能公司DeepSeek已經成為可能挑戰美國人工智能公司的競爭對手,展示了聲稱以部分成本提供與領先產品媲美的性能的突破模型。該公司的移動應用程式於一月初推出,最近在包括美國、英國和中國在內的主要市場的App Store排行榜上名列前茅,但仍未能擺脫對其所聲稱的真實性是否屬實的懷疑。
DeepSeek由2023年High-Flyer量化對沖基金的前首席Liang Wenfeng創立,其模型是開源的,並融入了一個在提供回應之前闡述其思維的推理功能。
華爾街的反應褒貶不一。雖然券商Jefferies警告說,DeepSeek的高效方法“刺破了Meta和微軟最近的資本支出狂喜”,這兩家公司今年的資本支出均超過600億美元,但花旗懷疑是否真的是在沒有先進GPU的情況下實現了這些結果。
高盛看到了更廣泛的影響,建議這一發展可能重塑已建立的科技巨頭和初創企業之間的競爭,降低進入壁壘。
以下是華爾街分析師對DeepSeek的反應,他們的話如下(重點我們):
Jefferies
DeepSeek對人工智能訓練的能量影響破壞了上週來自Stargate和Meta的重大承諾帶來的資本支出狂喜。隨著DeepSeek提供的性能可與GPT-4o相媲美,但所需的計算能力卻只有一小部分,AI玩家壓力不斷增大,不得不為資本支出計劃提供理由,最終可能導致資料中心收入和利潤增長軌道下調。
如果較小的模型能夠運作良好,這對智能手機可能是積極的。我們對人工智能智能手機持悲觀態度,因為人工智能在消費者中並未取得任何進展。需要進行更多硬件升級(高級封裝+高速DRAM)才能在手機上運行更大的模型,這將提高成本。蘋果的模型實際上是基於MoE,但30億個數據參數仍然太小,無法使服務對消費者有用。因此,DeepSeek的成功帶來了一些希望,但對AI智能手機的短期前景沒有影響。
由於芯片限制,中國是唯一追求LLM效率的市場。特朗普/穆斯克可能認識到進一步限制的風險是迫使中國更快地創新。因此,我們認為特朗普可能會放寬AI擴散政策。
花旗
雖然DeepSeek的成就可能是開創性的,但我們質疑其成果是在沒有使用先進GPU對其進行微調和/或通過蒸餾技術構建其基礎LLM的情況下完成的。儘管最先進的AI模型上美國公司的主導地位可能會受到挑戰,但我們估計在一個不可避免變得更加嚴格的環境下,美國公司獲得更先進芯片的優勢。因此,我們不認為領先的AI公司會從更先進的GPU移開,這些GPU在規模上提供了更具吸引力的$/TFLOPs。我們認為最近的AI資本支出宣布如Stargate是對需要更先進芯片的需要的一種示意。
Bernstein
簡而言之,我們認為1)DeepSeek並沒有“以500萬美元建造OpenAI”;2)這些模型看起來很棒,但我們認為它們並不是奇蹟;3)上週末關於GPT5仍未發布的Twitterverse恐慌似乎被夸大了。
我們自己的初始反應並不包括恐慌(遠非如此)。如果我們承認DeepSeek可能使實現相同模型性能的成本降低了,比如只有10倍,我們也指出,當前的模型成本軌跡每年增加約這麼多(臭名昭著的“尺度定律...”),這種增長無法持續下去。在這種情況下,如果人工智能要繼續發展,我們需要這樣的創新(MoE、蒸餾、混合精度等)。對於那些尋求人工智能應用的人來說,作為半導體分析師,我們堅定地相信傑文氏悖論(即效率增益會產生需求的淨增加),並且相信任何新的計算容量解鎖更有可能被吸收,因為使用率和需求增加,而不會影響長期支出展望此時,我們認為計算需求在人工智能中的使用還遠未達到其極限。此外,我們認為,DeepSeek正在部署的創新對大量世界其他多個頂尖人工智能研究人員所了解的完全未知(坦率地說,我們不知道大型封閉實驗室一直在使用什麼來開發和部署他們自己的模型,但我們只是無法相信他們沒有考慮甚至可能使用類似的策略)。
傑文斯悖論再次出現!隨著人工智能變得更有效率和更易用,我們將看到其使用量大幅增加,將其轉變為我們再也無法滿足的商品。https://t.co/omEcOPhdIz
— 薩提亞·納德拉(@satyanadella)2025年1月27日
摩根士丹利
我們尚未證實這些報告的真實性,但如果屬實,並且確實能夠以過往投資的一小部分開發出先進的LLM,我們可能會看到生成式人工智能最終在越來越小的計算機上運行(從超級計算機到工作站、辦公室計算機,最終到個人計算機),並且半導體行業將從生成式人工智能的需求增加中受益。
高盛
隨著最新發展,我們還看到1)資本富裕的互聯網巨頭和初創企業之間存在潛在競爭,由於降低了進入壁壘,特別是最近以比現有模型成本低很多開發的新模型;2)從訓練到更多的推理,更注重訓練後(包括推理能力和強化能力)需要的計算資源顯著低於前訓練需要的資源;以及3)對中國玩家進一步全球擴展的潛力,鑑於其性能和成本/價格競爭力。
我們預計AI應用/AI代理的競爭將繼續在中國進行,特別是在To-C應用領域,在這個領域,中國公司在互聯網時代的移動應用中一直是先驅,例如,騰訊創建了微信超級應用。在To-C應用中,字節跳動在過去一年推出了32個人工智能應用程式。其中,豆抱迄今在中國是最受歡迎的人工智能聊天機器人,擁有最高的月活用戶(約7000萬),最近已升級為豆抱1.5專業版。我們認為增量收入流(訂閱、廣告)以及應用/代理之間的最終/可持續的盈利路徑/積極單位經濟學將至關重要。
對基礎基礎層來說,投資者關注重點是在市場對AI資本支出和計算需求的預期是否存在短期錯位的情況下,如果成本/模型計算效率得到顯著提高,對中國雲/數據中心玩家而言,我們認為2025年的重點將圍繞在芯片供應的可用性和CSP(雲服務供應商)的能力,以提供AI驅動的雲收入增長所帶來的改進收入貢獻,且除了基礎架構/ GPU租賃外,AI工作負載和AI相關服務如何能有助於未來增長和利潤率。我們對長期AI計算需求增長持積極態度,因為計算/訓練/推理成本的進一步降低可能推動更高的人工智能應用。根據芯片供應的基於基本/悲觀場景的BBAT資本支出估計的主題#5,我們預計在2025年,基本情況下BBAT的總體資本支出增長將繼續(GSe:+38%;yoy),盡管與2024年的強勁增長(GSe:+61%;yoy)相比速度略微緩慢,這主要是由於持續投資AI基礎設施所致。
J.P.摩根
最重要的是,DeepSeek的研究論文和他們模型的效率引起了許多關注。目前尚不清楚DeepSeek在多大程度上利用了High-Flyer的約5萬個跳板GPU(與OpenAI培訓GPT-5的集群大小相似),但很可能是他們(例如,推理成本為GPT-4 Turbo的1/7)極大降低了成本。他們的顛覆性(雖然不是新的)主張在上週開始影響到美國人工智能名稱,即“更多投資不等於更多創新。”梁:“我現在看不到任何新的方法,但大公司並不具備明確的優勢。大公司有現有客戶,但現金流生意也是他們的負擔,這使它們容易受到隨時受到打擾的打擾。”當被問及GPT5仍未發布的事實時:“OpenAI不是一個神,他們不一定始終處於領先地位。”
瑞銀
在2024年,我們看到中國大規模的人工智能訓練工作量首次出現,80-90%的IDC需求是由AI訓練驅動的,集中在1-2個超大規模客戶中,這導致在相對偏遠地區的批發超大規模IDC需求增加(因為消耗電力的AI訓練對電費敏感,而不是使用者延遲)。
如果人工智能訓練和推理成本明顯降低,我們預計更多的終端用戶將利用人工智能來改善他們的業務或開發新的用例,特別是零售客戶。這樣的IDC需求意味著更多關注位置(因為用戶延遲比電費更重要),