【AI解碼】DeepSeek改寫華爾街估值規則

2025年2月3日下午16:53

在財華社作者毛婷原創文章《解構“星際之門”的財富密碼》一文中，已經提到，特朗普提出由軟銀出資、OpenAI出力，與甲骨文（ORCL.US）和中東科技投資公司MGX組建合營項目“星際之門”，在四年來投入5000億美元在美國建造新的AI基礎設施，可以預期，購買最尖端AI芯片的成本在這筆資本支出中將占大比重。除此以外，微軟（MSFT.US）、亞馬遜（AMZN.US）、Meta（META.US）、谷歌（GOOG.US）等也已經表明會在2025年大幅增加資本開支進行AI基礎設施的投入，其中AI芯片的支出會占較大比重。根據毛婷《DeepSeek改寫華爾街估值規則》文章分析，中國的AI模型僅用有限的芯片和低得多的成本就完美超越，最主要的原因是DeepSeek采用的是非OpenAI傳統的訓練方式——不拼算力，而是拼算法。當前的大模型通常采用監督微調（SFT）技術進行訓練，而DeepSeek-R1幾乎單純使用強化學習技術進行“後訓練”，很少使用SFT，從而減少了對大規模人工標注數據集的依賴，降低數據收集和標注的成本；R1模型通過學習思維鏈（CoT）的方式逐步推理而得出結果，而不是直接預測答案，極大地提升了推理能力，使模型在解決覆雜問題時能更有效地利用計算資源，避免了不必要的計算開銷。在資源利用方面，R1通過Multi-Head Latent Attention（MLA）和DeepSeek MOE架構節省了大量的現存，確保每個token下少量專家網絡參數被激活時，不同專家網絡能以更均衡的頻率被激活，更有效地使用硬件資源；設計出“對偶流水線”機制，將GPU用於數學運算和通信相關的算力進行並行隱藏，減少了GPU指令執行流水線中的“氣泡”，提升了GPU的使用效率，讓GPU幾乎不間斷地進行運算；限制了每個token發送到GPU集群節點的數量，並應用了FP8混合精度訓練架構，降低了通信開銷的同時加快了計算速度。研發方面，DeepSeek團隊或只有140名員工，而OpenAI有上千名員工。DeepSeek堅持開源策略，模型的代碼和訓練方法完全開源，吸引了不少開發者參與到模型的優化和改革中來，有效分攤了成本。正因如此，華爾街這一年來的估值邏輯被顛覆。有鑒於AI發展浪潮的迅猛，英偉達成為華爾街的寵兒，更兩度超越蘋果（AAPL.US）成為全球市值最高的上市公司，半導體產業鏈也得益於這波紅利而跑贏了大部分科技股。但是DeepSeek的這一下深度求索，扭轉了依靠AI芯片才能打造出最尖端大模型的邏輯，英偉達的香餑餑變得沒那麽香了。英偉達在R1發布後首個交易日的股價下探16.97%，蒸發掉接近6000億美元，差不多相當於七個英特爾（INTC.US）的市值。台積電的股價也下挫13.33%，阿斯麥亦下跌5.75%。能源公司Vistra和Constellation Energy更分別下挫28.27%和20.85%。值得留意的是，Meta的開源模型Llama首當其沖，同為開源模型，Llama的性能明顯跑輸，成本還不低，而紮克伯格已明確2025年將加大對AI的資本支出，這或引發投資者對其估值的思考，不過Meta的股價卻上升1.91%。二級市場的回落遲早將蔓延到一級市場，剛剛獲得估值大幅提升的OpenAI和Anthropic，下一輪融資不知道能獲得多少估值。閱讀原文：【美股解碼】解構“星際之門”的財富密碼財華網：https://www.finet.hk/newscenter/news_content/6790ca585a7712696a7d1dfd 財華智庫網：https://www.finet.com.cn/news/6790ca585a7712696a7d1dfd.html

更多精彩內容，請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)