在財華社作者毛婷原創文章《解構“星際之門”的財富密碼》一文中,已經提到,特朗普提出由軟銀出資、OpenAI出力,與甲骨文(ORCL.US)和中東科技投資公司MGX組建合營項目“星際之門”,在四年來投入5000億美元在美國建造新的AI基礎設施,可以預期,購買最尖端AI芯片的成本在這筆資本支出中將占大比重。除此以外,微軟(MSFT.US)、亞馬遜(AMZN.US)、Meta(META.US)、谷歌(GOOG.US)等也已經表明會在2025年大幅增加資本開支進行AI基礎設施的投入,其中AI芯片的支出會占較大比重。 根據毛婷《DeepSeek改寫華爾街估值規則》文章分析,中國的AI模型僅用有限的芯片和低得多的成本就完美超越,最主要的原因是DeepSeek采用的是非OpenAI傳統的訓練方式——不拼算力,而是拼算法。當前的大模型通常采用監督微調(SFT)技術進行訓練,而DeepSeek-R1幾乎單純使用強化學習技術進行“後訓練”,很少使用SFT,從而減少了對大規模人工標注數據集的依賴,降低數據收集和標注的成本;R1模型通過學習思維鏈(CoT)的方式逐步推理而得出結果,而不是直接預測答案,極大地提升了推理能力,使模型在解決覆雜問題時能更有效地利用計算資源,避免了不必要的計算開銷。在資源利用方面,R1通過Multi-Head Latent Attention(MLA)和DeepSeek MOE架構節省了大量的現存,確保每個token下少量專家網絡參數被激活時,不同專家網絡能以更均衡的頻率被激活,更有效地使用硬件資源;設計出“對偶流水線”機制,將GPU用於數學運算和通信相關的算力進行並行隱藏,減少了GPU指令執行流水線中的“氣泡”,提升了GPU的使用效率,讓GPU幾乎不間斷地進行運算;限制了每個token發送到GPU集群節點的數量,並應用了FP8混合精度訓練架構,降低了通信開銷的同時加快了計算速度。研發方面,DeepSeek團隊或只有140名員工,而OpenAI有上千名員工。DeepSeek堅持開源策略,模型的代碼和訓練方法完全開源,吸引了不少開發者參與到模型的優化和改革中來,有效分攤了成本。正因如此,華爾街這一年來的估值邏輯被顛覆。 有鑒於AI發展浪潮的迅猛,英偉達成為華爾街的寵兒,更兩度超越蘋果(AAPL.US)成為全球市值最高的上市公司,半導體產業鏈也得益於這波紅利而跑贏了大部分科技股。但是DeepSeek的這一下深度求索,扭轉了依靠AI芯片才能打造出最尖端大模型的邏輯,英偉達的香餑餑變得沒那麽香了。英偉達在R1發布後首個交易日的股價下探16.97%,蒸發掉接近6000億美元,差不多相當於七個英特爾(INTC.US)的市值。台積電的股價也下挫13.33%,阿斯麥亦下跌5.75%。能源公司Vistra和Constellation Energy更分別下挫28.27%和20.85%。值得留意的是,Meta的開源模型Llama首當其沖,同為開源模型,Llama的性能明顯跑輸,成本還不低,而紮克伯格已明確2025年將加大對AI的資本支出,這或引發投資者對其估值的思考,不過Meta的股價卻上升1.91%。 二級市場的回落遲早將蔓延到一級市場,剛剛獲得估值大幅提升的OpenAI和Anthropic,下一輪融資不知道能獲得多少估值。 閱讀原文: 【美股解碼】解構“星際之門”的財富密碼 財華網:https://www.finet.hk/newscenter/news_content/6790ca585a7712696a7d1dfd 財華智庫網:https://www.finet.com.cn/news/6790ca585a7712696a7d1dfd.html
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)