在GTC 2026台北大會上,英偉達CEO黃仁勳用兩個小時的演講傳遞了一個核心判斷:AI正在從"生成内容"階段進入"執行任務"階段,代理式人工智能(Agentic AI)將成為下一代計算的核心工作負載。
圍繞這一判斷,英偉達發佈了從芯片到平台、從雲端到終端的全綫産品佈局。
推理取代訓練,成為算力消耗的主戰場
黃仁勳在演講中明確指出,AI行業的算力瓶頸正在從模型訓練轉向推理。AI Agent在執行任務時需要長鏈推理、多輪規劃、工具調用和多Agent協同,每一步都消耗推理算力。
由此引出本次大會的硬件核心——Vera Rubin平台。該平台專為Agentic AI工作負載設計。其中,Vera CPU是英偉達面向AI Agent推出的全新處理器,強調極致單綫程性能和能效比, 旨在為現代 AI 工廠背後的 CPU 密集型工作提供動力,從代理式 AI 和強化學習,到數據處理和編排。
英偉達的設計邏輯很直接:AI Agent在執行任務時需要調用工具、查詢數據庫、運行代碼,這些操作對CPU的響應速度提出了與傳統數據中心截然不同的要求。
這對以AI作為重要賦能工具的AI應用型企業而言意味著實質性的成本拐點。以港股上市的明略科技(2718.HK)為例,該公司在2025年年報中披露,其Agentic AI相關業務已實現快速增長,核心驅動力之一正是推理成本的持續下降使得AI Agent大規模替代人工執行業務流程成為可能。推理算力每便宜一個數量級,Agent的商業化邊界就擴展一圈。
"Token是新的大宗商品"
演講中頻率最高的概念之一是"AI Factory"——AI工廠。黃仁勳將數據中心重新定義為"生産token的工廠",並首次係統闡述了token經濟學的定價框架:按速度和智能程度將token分為不同層級。
他甚至預言,Agent(智能體)將終結傳統SaaS模式,未來「年薪+Token預算」將成為職場新標配,token消耗將成為企業運營成本的常規科目。
過去一年,從矽谷到中國,已有一批企業開始嘗試以token消耗作為服務計價的基礎單元,將傳統的軟件訂閱費替換為"token成本+服務費"的模式。紅杉資本在近期一份報告中將這類企業描述為"披著服務商外衣的Agent公司"。
SaaS已死?Agentic Service正在重塑軟件行業
過去半年,從Salesforce推出Agentforce到ServiceNow上綫AI Agent平台,從SAP重新定義"業務AI"到國内多家企業級軟件公司調整産品路綫,"Agent取代工具"正在成為企業軟件行業的共同方向。
在中國市場,明略科技是這一轉型中走得較早的公司之一。據其2025年年報,公司全年實現收入14.26億元,毛利率55.4%,經調整淨利潤首次扭虧為盈。業務模式上,公司正從傳統SaaS交付轉向Agentic Service,通過AI Agent直接為客戶執行廣告投放、内容生産等業務環節。今年5月,公司還發佈了搭載端側AI模型的智能會議終端Octic,將Agent能力延伸至硬件場景。
當然,無論是Salesforce還是明略科技,Agentic Service模式整體仍處於産業早期,規模化復制能力和客戶留存率有待更長周期的檢驗。其仍取決於Agentic AI能否真正從概念進入規模化落地。但至少,當全球市值最高的企業之一將整條産品綫對準"Agent"這個方向時,産業界對這一趨勢的共識正在加速形成。
内容來源:有連雲
更多精彩內容,請登陸
財華香港網 (https://www.finet.hk/)
現代電視 (http://www.fintv.com)