請輸入關鍵字:

熱門搜尋:

黃仁勳:從CUDA賭注到AI工廠,英偉達如何預見與塑造未來

 
日期: 2026年5月24日 下午6:30

撰文:Techub News 整理

近日,英偉達CEO黃仁勳做客Lex Fridman Podcast,進行了長達145分鐘的深度對話。作為驅動AI革命的核心引擎,英偉達的成功與其領導者的戰略遠見和工程哲學密不可分。此次訪談不僅回顧了公司歷史上關鍵的生死決策,更展望了AI未來演進的方向與挑戰,是理解當前AI基礎設施與計算範式變革的重要窗口。

極致協同設計:超越摩爾定律的係統工程

黃仁勳首先闡釋了英偉達當前的核心工程理念——「極致協同設計」。他指出,問題已不再局限於單個計算機或單個GPU的加速。當你要用一萬台計算機實現百萬倍的加速時,就必須將算法分解、重構,進行流水綫、數據和模型的分片。一旦問題以這種方式分佈,一切都會成為瓶頸。

這就是阿姆達爾定律的問題:加速程度取決於該部分佔總工作負載的比例。如果計算只佔問題的50%,即使將計算無限加速,整體工作負載也只能提升兩倍。因此,不僅要分佈計算,還要解決網絡問題,因為所有這些計算機都連接在一起。

在我們所從事的規模下進行分佈式計算,CPU、GPU、網絡、交換、工作負載分佈都是問題。這是一個極其復雜的計算機科學問題。我們必須動用所有技術,否則只能實現綫性擴展,或者依賴摩爾定律的能力擴展,而後者因登納德縮放放緩已基本減速。

黃仁勳強調,協同設計優化涉及整個軟件棧,從架構到芯片,到係統、係統軟件、算法,再到應用。這還超越了CPU、GPU和網絡芯片,包括縱向擴展和橫向擴展的交換機。當然,還必須包括電源和冷卻,因為這些計算機功耗極高。它們工作效率很高,但總量仍消耗大量電力。

那麼,如何讓内存、網絡、NVLink、NIC、光模塊、銅纜、電源輸送、冷卻等各領域的世界專家在一起協作?黃仁勳的答案直接反映在公司架構上:「公司的目標就是産出,産出就是我們創造的産品。公司的架構應該反映其存在的環境。」他的直接下屬有60人,幾乎所有人都至少涉足工程領域。有内存專家、CPU專家、光學專家、GPU專家,以及架構、算法、設計專家。

因此,他始終關注整個堆棧,進行激烈的討論。沒有對話是單人的,這也是他不進行一對一會議的原因。他們提出一個問題,所有人共同解決。因為公司在持續進行極致協同設計。即使討論特定組件如冷卻或網絡,每個人都在傾聽並可以貢獻意見:「這不利於配電」、「這對内存不適用」。誰想退出就退出,下屬們知道何時該關注。如果有人本可貢獻卻沒有,他會點名:「嘿,過來參與。」這種組織方式是為了應對極端協同設計的需要。

從加速器到計算平台:CUDA的生死賭注

黃仁勳回顧了英偉達從加速器公司向計算平台演進的關鍵轉折。起步時作為加速器公司,其優勢在於針對任務極致優化,但問題在於應用領域太窄。深度專業化的市場範圍更窄,而市場規模決定了研發能力,研發能力最終決定了你在計算領域可能的影響力和影響範圍。

他們始終知道,成為加速器只是第一步。必須找到方法成為「加速計算」公司。但成為計算公司又過於通用,會削弱專業化。這兩個詞存在根本性的張力:我們越是成為優秀的計算公司,作為專家就越糟糕;越是專家,從事整體計算的能力就越弱。公司必須找到那條狹窄的道路,一步一步擴大計算的範圍,同時不放棄最重要的專業化。

超越加速的第一步是發明了可編程像素著色器,這是邁向可編程性的第一步。第二步是在著色器中加入FP32(符合IEEE標準的FP32),這是邁向計算的一大步。正是這一步,讓那些研究流處理器和其他類型數據流處理器的人們發現了我們,並開始嘗試使用GPU。這引導我們創造了Cg,最終通向CUDA。

將CUDA放在GeForce上是一個戰略決策,非常艱難,因為它消耗了公司巨大的利潤,當時我們負擔不起。但我們還是做了,因為想成為一家計算公司。計算公司需要有計算架構,計算架構必須在我們構建的所有芯片上兼容。

黃仁勳詳細解釋了這一決策。他們發明了CUDA,擴大了加速器可加速的應用範圍。問題是如何吸引開發者?計算平台的一切關乎開發者。開發者來到一個計算平台,是因為其安裝基數大。開發者希望開發的軟件能觸及很多人。因此,安裝基數實際上是架構最重要的部分。架構可能招致大量批評,例如x86架構作為「不夠優雅的架構」,卻是當今的定義性架構。許多設計精美、由世界頂尖計算機科學家設計的RISC架構卻大多失敗了。這說明了安裝基數定義了一個架構,其他都是次要的。

當時還有其他架構,CUDA問世,OpenCL存在,還有其他幾個競爭架構。他們做出的正確決策是:歸根結底是關於安裝基數,我們如何能將新的計算架構帶入世界?那時GeForce已經成功,每年銷售數百萬GeForce GPU。他們認為應該在GeForce上搭載CUDA,放入每一台PC,無論客戶是否使用,以此作為培育安裝基數的起點。同時,他們將去吸引開發者,去大學、寫書、授課,到處推廣CUDA。最終人們會發現它。那時PC是主要計算工具,沒有雲,我們可以將超級計算機送到每個學校的研究人員、科學家、工程學院、每個學生手中,最終會有驚人的事情發生。

問題是CUDA大幅增加了那個消費級GPU的成本,完全消耗了公司所有的毛利美元。當時公司市值大約80億美元?推出CUDA後,市值跌至約15億美元。他們在低谷徘徊了一段時間,慢慢掙紮回來,但始終堅持在GeForce上搭載CUDA。黃仁勳常說,英偉達是GeForce建造的房子,因為是GeForce將CUDA帶給所有人。研究人員、科學家們在GeForce上發現了CUDA,因為他們很多是遊戲玩家,很多人自己組裝PC,大學實驗室裡很多人用PC組件自己搭建集群。這就是他們起步的方式。

這後來成為了深度學習革命的平台和基礎。黃仁勳回憶了那段 existential moment。他必須向董事會澄清他們要做什麼,管理團隊也知道毛利率會受到重創。可以想象一個世界,GeForce承擔CUDA的負擔,但遊戲玩家不會欣賞,也不會為此付費。他們只付一定價格,不管成本是多少。他們將成本增加了50%,而當時他們是毛利率35%的公司,這是一個相當艱難的決定。但可以想象,有一天這會進入工作站和超級計算機,在這些細分市場或許能獲取更多利潤。即便如此,仍然花了十年時間。

關於如何做出如此大膽的、預測未來甚至定義未來的決策,黃仁勳分享了他的思考方式。首先,他受到大量好奇心的驅使。在某個時刻,會有一個推理係統讓他確信這個結果會發生。他在心中相信它,當你心中相信時,你就會顯化一個未來,那個未來如此令人信服,不可能不發生。中間會有很多痛苦,但你必須相信你所相信的。他 envision the future,並從工程角度 essentially manifest it。他推理如何到達那裡,推理為什麼它必須存在。管理團隊也會推理,他花費大量時間推理。

領導力的另一部分可能是技能問題。通常領導保持沉默或學習某事,然後發表宣言,新年全新計劃,大規模裁員,組織變革,新使命宣言,新Logo等等。他們從不那樣做。當他學到某事並開始影響他的思考時,他會向身邊所有人明確表示,這很有趣,這將産生影響。他一步一步推理事物。通常他已下定決心,但會利用每一個機會——外部信息、新見解、新發現、新的工程啓示、新裡程碑——利用這些機會塑造每個人的信念係統。他每天都在這樣做,對董事會、管理團隊、員工這樣做。

因此,當他有一天說「讓我們收購Mellanox」時,所有人都完全明白絕對應該這樣做。當他宣佈「讓我們全力投入深度學習」時,他已經為公司内部不同組織鋪墊了基礎。每個組織和每個人可能都聽過部分内容。當他宣佈時,每個人都已經接受了許多部分。很多時候,他喜歡宣佈這些事情,並想象員工們在說:「黃仁勳,你怎麼這麼久才說?」事實上,他已經塑造他們的信念係統一段時間了,因此領導有時看起來像是從後面領導,但在他宣佈之日,100%認同。這正是你想要的,你想讓每個人都跟上。否則,你宣佈關於深度學習的事情,每個人都會問「你在說什麼?」你宣佈全力投入某事,你的管理團隊、董事會、員工、客戶都會覺得「這從哪來的?這太瘋狂了。」

GTC的效果也是如此。回顧過去的主題演講,他也在塑造行業合作夥伴的信念係統,並以此塑造自己員工的信念係統。因此當他宣佈某事時,比如剛剛宣佈的Grok,他已經談論鋪墊了兩三年。回溯時會發現,「天哪,他們已經談了兩年半了。」他一步一步鋪墊基礎,所以時機到來時宣佈,每個人都說「你怎麼這麼久才說?」

這不僅在公司内部,他還在塑造更廣泛的全球創新格局。將那些想法傳播出去,他確實在顯化現實。他們不制造計算機,實際上也不建造雲。他們是計算平台公司,沒人能從他們那裡購買任何東西。這很奇怪。他們縱向設計、縱向集成以設計和優化,然後在每一層開放整個平台,集成到其他公司的産品、服務、雲、超級計算機、OEM計算機中。神奇的是,如果沒有先說服他們,他就做不到他所做的事。因此GTC的大部分内容是關於顯化一個未來,當産品準備好時,他們會說「你怎麼這麼久才說?」

預見AI演進:四個縮放定律與未來瓶頸

黃仁勳長期相信縮放定律,並現在提出了更多縮放定律。他概述了四個:預訓練、後訓練、測試時和代理縮放。回顧過去人們認為的瓶頸,最初是預訓練縮放定律。人們合理認為,我們擁有的高質量數據量將限制我們實現的智能。這個縮放定律非常重要:模型越大,相應地更多數據會産生更聰明的AI。這就是預訓練。當Ilya Sutskever說「我們沒數據了」或「預訓練結束了」之類的話時,行業恐慌,認為這是AI的終結。當然,這顯然不對。我們將繼續縮放用於訓練的數據量。很多數據可能是合成的,這也讓人困惑。人們沒有意識到,我們用來互相教導、通知的數據大多是合成的。因為它不是自然産生的,你創造了它,我消費它,我修改、增強、再生它,別人消費它。

現在AI已經能夠獲取基本事實,增強它,合成生成大量數據。後訓練這部分繼續縮放,因此我們使用的由人類生成的數據量將越來越小。用於訓練模型的數據量將繼續縮放,直到我們不再受限制……訓練不再受……數據現在受計算限制。原因是大多數數據是合成的。

下一階段是測試時縮放。他仍記得人們告訴他:「推理?哦,那很容易。預訓練很難。」人們談論的是巨型係統。推理一定很容易。推理芯片會是小小的芯片,不像英偉達的芯片。哦,那些會很復雜昂貴,我們可以制造……未來推理將是最大市場,而且很容易,我們將使其商品化。每個人都可以制造自己的芯片。這對他來說一直不合邏輯,因為推理是思考,他認為思考很難。思考比閱讀難得多。預訓練只是記憶和泛化,尋找關係和模式。你在閱讀,而思考、推理、解決問題、分解未探索的新經驗為可解決的部分,然後通過第一原理推理或先前例子、經驗,或探索、搜索、嘗試不同事物去解決。整個測試時縮放、推理過程,真的是關於思考。是關於推理、規劃、搜索……這怎麼可能計算量小?他們絕對正確,測試時縮放計算強度極高。

那麼,超越推理和測試時縮放的是什麼?顯然,我們現在創造了一個代理性個體,擁有我們開發的大型語言模型。但在測試時,那個代理係統會去做研究、訪問數據庫、使用工具,其中最重要的一件事是分裂衍生出大量子代理。這意味著我們現在創建大型團隊。通過僱佣更多員工來縮放英偉達比縮放我自己容易得多。因此下一個縮放定律是代理縮放定律,有點像乘法AI。我們可以根據需要快速衍生代理。

他有四個縮放定律。當我們使用代理係統時,它們將創造更多數據、更多經驗。其中一些我們會說「哇,這真好,我們應該記住。」那個數據集然後回到預訓練,我們記憶並泛化它。然後我們在後訓練中精煉和微調它。然後在測試時進一步增強,代理係統將其推向行業。這個循環、這個周期將持續進行。最終歸結為一點:智能將通過一件事縮放,那就是計算。

但這裡有一個棘手的問題需要預測:其中一些組件需要不同的硬件才能真正最優地完成。你必須預測AI創新將導向何方。例如,混合專家與稀疏性。硬件不能在一周内轉向,你必須預測它會是什麼樣子。這很可怕且困難。AI模型架構大約每六個月發明一次,係統架構和硬件架構大約每三年一次。因此你需要預測兩三年後可能發生什麼。

有幾種方法可以做到。首先,他們可以自己内部進行研究,這也是他們擁有基礎研究、應用研究的原因。他們創建自己的模型,因此有親身體驗。這也是他所說的協同設計的一部分。他們也是世界上唯一與世界上幾乎所有AI公司合作的AI公司。因此盡可能嘗試了解人們正在經歷的挑戰。

他們在傾聽整個行業、AI實驗室的 whispers。必須傾聽並向所有人學習。最後一部分是擁有一個靈活的架構,能夠適應並隨風而動。CUDA的一個好處是,一方面它是 incredible accelerator,另一方面它非常靈活。那種平衡—— specialization 與 generalization 之間的 incredible balance,否則無法加速CPU,而 generalization 使我們能夠適應變化的算法——非常重要。這就是CUDA一方面如此 resilient,另一方面我們持續增強的原因。他們現在是CUDA 13.2,架構演進如此之快,可以跟上現代算法。

例如,當混合專家出現時,這就是他們擁有NVLink 72而不是NVLink 8的原因。他們現在可以將整個四萬億、十萬億參數模型放入一個計算域,就像在一個GPU上運行一樣。Grace Blackwell機架的架構完全專注於一件事:處理LLM。一年後,你看到Vera Rubin機架。它有存儲加速器,有一個 incredible new CPU called Vera,有Vera Rubin和NVLink 72來運行LLM,還有一個新的附加機架叫Rock。整個機架係統與上一個完全不同,有所有這些新組件。原因是上一個設計用於運行MoE大型語言模型推理,而這個用於運行代理,代理使用工具。

顯然,係統的設計必須在Claude Code、Codex、OpenClaw之前完成。他們 essentially anticipating the future。這來自 whispers,來自理解所有 state of the art 嗎?黃仁勳說,不,比那更容易。你只需推理。無論發生什麼,為了讓那個大型語言模型成為數字工作者……我們就用這個比喻。假設我們希望LLM成為數字工作者。它必須做什麼?它必須訪問基本事實,那是我們的文件係統。它必須能夠做研究,它不知道一切。我不想等到這個AI變得 universally smart about everything,過去、現在和未來,才讓它有用。因此不如讓它去做研究。顯然,如果它想幫助我,它必須使用我的工具。

很多人會說「AI將徹底摧毀軟件,我們不需要軟件了,甚至不需要工具了。」這很荒謬。用一個思想實驗,你可以坐在那裡,享受一杯威士忌,思考所有這些事情,它會變得 completely obvious。比如,如果我要創造未來10年我們能想象的最 amazing agent,假設它是一個人形機器人。如果那個人形機器人被創造出來,更可能是人形機器人進入我的房子並使用我擁有的工具來完成它需要的工作,還是這只手在一種情況下變成十磅錘,另一種情況下變成手術刀,為了燒水,它從手指發射微波?或者更可能只是使用微波爐?第一次它走到微波爐前,可能不知道怎麼用。但沒關係,它連接到互聯網,閱讀這個微波爐的手冊,閱讀後 instantly becomes an expert。因此它使用它。

他認為,他剛剛描述了OpenClaw幾乎所有的特性。它將使用工具,訪問文件,能夠做研究。它有I/O子係統。當你這樣推理完,推理關於它,然後你說「天哪,對未來計算的影響 deeply profound。」原因是,他認為我們剛剛 reinvented the computer。然後你說「好吧,我們什麼時候推理了OpenClaw?」如果你看他GTC使用的OpenClaw示意圖,你會發現兩年前。 literally,兩年前在GTC,他就在談論 exactly reflect OpenClaw today 的代理係統。當然,許多事情的 confluence 必須發生。首先,我們需要Claude、GPT所有這些模型達到一定能力水平。因此他們的創新、突破和持續進步非常重要。然後,當然,有人必須創建一個開源項目,足夠 robust、足夠完整,我們可以投入使用。他認為OpenClaw為代理係統所做的,正是ChatGPT為生成係統所做的。他認為這是一個非常大的事件。

關於未來的瓶頸,黃仁勳認為電力是一個擔憂,但不是唯一的擔憂。這也是他們如此努力推動極致協同設計的原因,以便每年將每瓦每秒令牌數提高數個數量級。過去10年,摩爾定律將使計算進步約100倍,而他們過去10年將計算縮放了一百萬倍。他們將通過極致協同設計繼續這樣做。因此能源效率、每瓦性能完全影響公司的收入,影響工廠的收入。他們將推動到極限,以便盡可能快地降低令牌成本。計算機價格上漲,但令牌生成效率提升更快,令牌成本在下降,每年下降一個數量級。

關於供應鏈瓶頸,如ASML的EUV光刻機、台積電的CoWoS先進封裝、SK海力士的高帶寬内存,他一直在關注並持續工作。歷史上沒有公司以他們這樣的規模增長同時加速增長。這 incredible,人們甚至難以理解。在AI計算的整個世界,他們正在增加份額。因此供應鏈上下遊對他們非常重要。他花費大量時間告知所有合作的CEO,什麼動態將導致增長持續甚至加速。這也是他右側坐著整個IT行業上遊和整個基礎設施行業下遊幾乎所有CEO的原因。有數百位CEO,他認為從未有過 keynote 數百位CEO出席。部分原因是他在告訴他們當前的業務狀況,告訴他們不久的未來的增長驅動因素和正在發生的事情,並描述下一步去向,以便他們利用所有這些信息和這裡的動態來 inform how they want to invest。

他這樣 inform them,就像 inform his own employees。然後當然,他去拜訪他們,確保「嘿,聽著,我想讓你知道這個季度、今年、明年,這些事情會發生。」如果你看DRAM行業的CEO,世界上第一的DRAM是數據中心CPU的DDR内存。大約三年前,他能夠說服幾位CEO,盡管當時HBM内存使用相當稀少, barely by supercomputers,但這將是未來數據中心的主流内存。起初聽起來荒謬,但幾位CEO相信了他,決定投資建造HBM内存。另一種内存是將用於手機的低功耗内存用於數據中心的超級計算機,這相當奇怪。他們問「用於超級計算機的手機内存?」他向他們解釋為什麼。看這兩種内存,LPDDR5、HBM4。 volume 如此 incredible。所有三家都有歷史 record years,這些是45年的公司。因此, inform and shape, inspire 是他工作的一部分。

他不僅在顯化未來、或許 inspiring NVIDIA,還在 manifesting the supply chain of the future。他與台積電、ASML、上下遊進行對話。上遊、下遊。GEV、卡特彼勒,那是他們的下遊。整個半導體行業有 incredibly difficult engineering,供應鏈 intricate,組件眾多,但 somehow works。

深度科學、深度工程、 incredible manufacturing,許多制造已經是機器人,但他們有數百家供應商貢獻技術,進入他們130萬組件的機架。每個Vera Rubin機架有200家供應商。他不將此列為讓他夜不能寐的 blocker list,因為他正在做所有必要的事情去解決。他可以睡覺,因為他 check it off。他推理:什麼對我們重要?因為他們改變了係統架構,從最初的DGX-I到NVLink-72 rack scale computing,這意味著什麼?對軟件意味著什麼?對工程意味著什麼?對設計和測試意味著什麼?對供應鏈意味著什麼?其中一件事是,他們將數據中心超級計算機集成移至供應鏈中的超級計算機制造。如果你這樣做,還必須認識到你將移動……如果你想建造,假設你想有50吉瓦的超級計算機同時運行,制造那50吉瓦超級計算機需要一周,那麼供應鏈每周需要一吉瓦電力來建造和測試超級計算機 before I ship it。

NVLink-72 literally builds supercomputers in the supply chain and ships 'em two, three tons at a time per rack。過去它們是零件,我們在數據中心内組裝。但現在不可能,因為NVLink-72如此密集。這是一個例子。他必須飛往供應鏈,去見合作夥伴說「嘿,猜猜看?我要這樣處理……這是我們過去建造DGX的方式,我們將這樣建造。這將更好,因為我們需要它們進行推理。」推理市場即將到來,推理 inflection point 即將到來,將是 big market。因此他首先向他們解釋發生了什麼,為什麼會發生,然後請他們 each make several billion dollars of capital investments。因為他們 trust him,他非常尊重他們,給他們 every opportunity to question him,他花費時間向人們解釋,推理,畫圖, first principles 推理。當他完成時,他們知道該做什麼。

這很大程度上是關於關係和 building a shared view of the future。但他是否擔心某些瓶頸?供應鏈最大的瓶頸是什麼?他擔心ASML的EUV工具嗎?擔心台積電的CoWoS封裝 scaling 速度嗎?他說不僅增長 incredibly fast,還在 accelerating your growth。感覺供應鏈每個人都必須 scale up。他與他們對話,如何能 scale up faster?他擔心嗎?黃仁勳回答:不。因為他告訴他們他需要什麼,他們理解他需要什麼,他們告訴他他們將做什麼,他相信他們將做什麼。

能源、開源與AI的未來影響

關於能源問題,黃仁勳希望探討並傳播一個觀點:我們的電網是為最壞情況設計的,帶有一些 margin。99%的時間我們 nowhere near the worst case condition,因為最壞情況是冬天幾天、夏天幾天和極端天氣。大多數時間我們 nowhere near the worst case condition,可能運行在約60%峰值。因此99%的時間,電網有 excess power,它們只是閑置,但必須在那裡閑置以防萬一,當需要時醫院必須供電,基礎設施必須供電,機場必須運行等等。

他的問題是,我們能否幫助他們理解並創建合同協議,設計計算機架構係統、數據中心,以便當他們需要社會基礎設施 maximum power 時,數據中心獲得較少電力。但這在非常罕見的情況下 anyway。在此期間,我們要麼有備用發電機應對那一小部分,要麼讓計算機將工作負載轉移到其他地方,或者讓計算機運行 slower。我們可以降低性能,減少功耗,提供 slightly longer latency response。因此他認為,那種使用計算機、建造數據中心的方式,而不是 expecting 100% uptime,以及那些 rigorous contracts,給電網帶來很大壓力,它們必須從最大值增加。他只是想使用他們的 excess,它就在那裡閑置。

阻礙因素是什麼?是監管?官僚主義?他認為這是一個三方問題。始於最終客戶。最終客戶對數據中心提出要求,它們必須永遠可用,因此最終客戶 expects perfection。為了交付 perfection,你需要備用發電機和電網電力供應商的組合來交付 perfection。因此每個人都必須有六個九。他認為首先,現在應該讓每個人明白,當客戶要求這些時,數據中心運營團隊中有人 disconnected from the CEO。他敢打賭CEO不知道。他將與所有CEO交談。CEO probably not paying any attention to the contracts that are being signed,因此每個人都想簽 best contract。他們去找雲服務提供商,合同談判雙方都想要 best contract。結果CSPs then have to go down to the utilities,他們 expects the nine, the six nines。

因此第一件事是確保所有客戶、CEO和客戶意識到他們在要求什麼。第二件事是建造 gracefully degrade 的數據中心。因此如果電力、如果 utility、如果電網告訴我們「聽著,我們必須將你降至約80%」,我們會說「沒問題。」我們將移動工作負載,確保數據永不丟失,但可以降低計算速率,使用更少能源。服務質量 slightly degrade。對於關鍵工作負載,我立即將其轉移到其他地方,因此沒有問題,哪個數據中心仍有100% uptime。

那麼,數據中心智能動態分配電力的工程問題有多難?黃仁勳說:一旦你能 specify,就能 engineer it。只要它遵循 first principles 的物理定律,他認為沒問題。

關於開源,黃仁勳提到了Perplexity,並感謝他們開源Nemotron 3 Super。這是一個1200億參數開放權重的MoE模型。他的開源願景是什麼?他提到中國有DeepSeek、MiniMax等公司推動開源AI運動,英偉達在接近 state-of-the-art 的開源LLMs方面 leading the way。

首先,如果他們想成為一家偉大的AI計算公司,必須理解AI模型如何演進。他喜歡Nemotron 3的一點是,它不僅僅是純Transformer模型,而是Transformer和SSMs。他們早期開發了 conditional GANs,逐步 leading to diffusion。因此他們在模型架構和不同領域進行基礎研究,讓他們 visibility into 未來模型需要什麼樣的計算係統。這是他們極致協同設計戰略的一部分。

第二,他們合理認識到,一方面他們希望世界級模型作為産品,它們應該是專有的。另一方面,他們也希望AI擴散到每個行業、每個國家、每個研究人員、每個學生。如果一切都是專有的,很難進行研究,也很難在其上、周圍、與其一起創新。因此開源對於許多行業加入AI革命 fundamentally necessary。英偉達有 scale,我們有動機——不僅是技能、規模,還有 motivation to build and continue to build these AI models for as long as we shall live。因此我們應該這樣做。我們可以開放,激活每個行業、每個研究人員、每個國家加入AI革命。

第三個原因是,認識到AI不僅僅是語言。這些AI可能會使用工具、模型和子代理,這些是在其他信息模態上訓練的。可能是生物學、化學、物理定律、流體和熱力學,並非所有都是語言結構。因此有人必須確保天氣預報、生物學AI、物理AI等所有東西都能被推到極限和 frontier。他們不制造汽車,但希望確保每個汽車公司都能訪問 great models。他們不 discover drugs,但希望確保禮來擁有 world's best biology AI systems,以便他們用於 discover drugs。

這三個根本原因,包括認識到AI不僅僅是語言,AI非常 broad,希望讓每個人參與AI世界,以及AI的協同設計。

AI與人類未來:工作、智能與希望

關於AI對人類工作的影響,黃仁勳以放射學為例。十年前,人們警告AI將取代放射科醫生,導致該領域人數下降。但事實是,今天每個放射學平台和軟件包都由AI驅動,放射科醫生數量卻增長了。現在世界放射科醫生短缺。因此 alarmist warning went too far,嚇跑了從事這一對社會重要職業的人,造成了傷害。為什麼錯了?因為放射科醫生的目的是診斷疾病,幫助患者和醫生診斷疾病。因為我們現在能以更快速度研究掃描,你可以研究更多掃描,更好診斷,更快住院,看更多人。醫院賺更多錢,醫院有更多患者,你需要更多放射科醫生。神奇的是,這 obvious this was gonna happen。

英偉達軟件工程師的數量將增長,而非 decline。原因是軟件工程師的目的和任務——編碼——相關,但不同。他希望軟件工程師解決問題,不在乎他們寫多少行代碼。但他們的工作目的沒有改變:解決問題、團隊合作、診斷問題、評估結果、尋找新問題解決、創新、連接點。這些都不會消失。

關於編碼,他認為世界程序員數量可能增加而非減少。原因是,編碼的定義是什麼?他相信,今天的編碼定義 simply specification,如果你想 directive,甚至可以給它你想寫的軟件架構。問題是,多少人能做到?描述計算機要構建的 specification。多少人?他認為我們從3000萬 probably 到10億。因此未來的每個木匠都將成為編碼員, except a carpenter with AI is also an architect。他們剛剛提升了能為客戶交付的價值,他們的 artistry just elevated tremendously。他認為每個會計師也是你的財務分析師、財務顧問。所有這些職業剛剛被 elevated。

目前的程序員和軟件工程師,他們處於前沿,直覺理解如何與代理用自然語言交流以設計最佳軟件。隨著時間的推移他們會 converge,但學習編程、了解編程語言是什麼、舊式編程、編程語言的良好實踐、大型軟件係統的設計原則仍有價值。 specification 的目標和 artistry 將取決於你想解決什麼問題。當他思考為公司提供戰略、制定公司方向時,他描述的 level sufficiently specific that people generally understand the direction and it's actionable,但 under specify it on purpose,以便 enable 43,000 amazing people to make it even better than I imagined。當他與工程師和人們工作時,他思考 trying to solve what problem? Who am I working with? specification level, architecture definition level relates to that。因此每個人都必須學習在 coding spectrum 中他們想處於何處。寫 specification 就是 coding。你可能決定相當 prescriptive,因為你尋求非常 specific outcome。你可能決定這是一個你想更 exploratory 的領域,因此你可能 under specify 並 enable you to go back and forth with the AI to even push your own boundaries of creativity。因此這種在 spectrum 中的 artistry,是 coding 的未來。

對於工作焦慮,他的第一個建議是分解問題。對於你能做些事情的事情,推理並去做。如果今天僱佣新畢業生,有兩個選擇,一個對AI一無所知,一個是使用AI的專家,他會僱佣使用AI的專家。如果是會計師、營銷人員、供應鏈、客戶服務、銷售人員、業務發展、律師,他會僱佣使用AI的專家。因此他建議每個大學生、每個老師應鼓勵學生使用AI。每個大學生應畢業成為AI專家。每個人,如果你是木匠、電工,去使用AI。去看看它能如何轉變你當前的工作, elevate yourself。如果是農民,他絕對會用AI。如果是藥劑師,他會用AI。他想看看它能做什麼來 elevate my job,以便我能成為 innovator to revolutionize this industry myself。

技術將 dislocation 並消除許多任務,如果自動化了它們。如果你的工作是任務,那麼你將 highly disrupted。如果你的工作目的包括你,某些任務,那麼 vital that you go learn how to use AI to automate those tasks。中間有 spectrum。

關於人類意識中 fundamentally non-computational 的部分,黃仁勳認為芯片可能永遠不會 nervous。當然,導致焦慮或緊張或其他情緒的條件。他相信AI將能夠識別和理解這些,但他的芯片不會 feel those。因此那種焦慮、感覺、興奮如何 manifest in human performance。例如, extremely amazing human performance, athletic performance, average or lesser than average。相同 circumstances 下不同人表現不同 outcome, performance 的 spectrum。他認為他們 building anything 中沒有 suggest that two different computers being presented with all of exactly the same context would perform differently。當然,它會産生 statistically different outcomes,但不是因為它 felt different。

主觀體驗 truly special。 scaling 可以在 intelligence 領域創造 incredible miracles。他 open to surprise。

重要的是分解 intelligence 是什麼。這個詞我們常用,它不是神秘的詞。 intelligence 有含義,是一個係統,包括感知、理解、推理、計劃能力。那個 loop 是 intelligence 的根本。 intelligence 不是 exactly equal to humanity 的一個詞。他認為非常重要將兩者分開。 intelligence 是 commodity。他 surrounded by intelligent people,每個領域都比他更 intelligent。然而他在 circle 中有角色。他們比他 more educated,上 better schools,在各自領域 deeper。所有60人都是 superhuman to him。 somehow, I'm sitting in the middle orchestrating all 60 of 'em。你必須問自己,一個 dishwasher 如何能坐在 superhumans 中間?但那是他的觀點。 intelligence 是 functional thing。 humanity 不是 specified functionally,是 much bigger word。我們的生活經驗、 tolerance for pain、 determination 是不同的詞。

他想幫助觀眾理解一件事: intelligence 是一個我們隨時間 elevated to a very high form 的詞。我們應該真正 elevate 的詞是 humanity。 character, humanity。 compassion, generosity。所有這些他剛剛說的,他相信那些是 superhuman powers。現在 intelligence 將被 commoditized。即使他們說最重要的是教育,當你上學時,你獲得的不僅僅是知識。但不幸的是,我們的社會將所有東西放入一個詞,生活不止一個詞。他告訴你,他的生活表明, intelligence curve 低於周圍所有人,並不改變我是最成功的事實。他希望 inspire everybody else that don't let this democratization of intelligence, this commoditization of intelligence cause you anxiety。你應該 inspired by that。

AI將幫助我們 celebrate humans more。 humanity and human first,讓這個世界 incredible 的是 humans forever will be so,AI是 incredible tool 讓我們 humans more powerful。

關於 mortality,黃仁勳說:我真的不想死。我有 great life, great family, really important work。這不是 once in a lifetime experience, suggests that it has been experienced by many people, just not one person。這是 once in a humanity experience。英偉達是歷史上最重要的技術公司之一,他們在做非常重要的工作,他非常認真對待。

一些 practical things,比如 succession planning。他 famous in saying that I don't believe in succession planning。原因不是因為他 immortal,而是如果你擔心 succession planning,那麼你應該做什麼?你應該分解它。如果你關心公司在你之後的未來,今天最重要的事情是盡可能頻繁、持續地傳遞知識、信息、洞察、技能、經驗。這就是他持續在團隊面前推理一切的原因。每個會議都是推理會議,他在公司内外的每一刻都是 about passing on knowledge to people as fast as I can。他學到的東西 never sits on my desk longer than a fraction of a second。他在傳遞信息,天哪,這很酷。在他自己完全學會之前, already pointing it to somebody else。「開始這個,這太酷了,你會想學的。」因此他 constantly passing knowledge, empowering people, elevating the capability of everybody around me,以便他尋求的結果是,他 die on the job。希望他 die on the job instantaneously,沒有 long periods of suffering。

關於希望,黃仁勳 always had a great confidence in the kindness, generosity, compassion, human capacity。有時 confidence 超出應有,他被利用,但 never cause me not to。他總是 start with that people want to do good, help others。 vast majority,他 constantly proven right, often exceeds my expectations。因此他對 human capacity 有 complete confidence。

給他 incredible hope 的是,他看到 possible, extrapolate based on what we're doing, what will very likely happen。有那麼多問題想解決,那麼多東西想建造,那麼多好事想做,現在 within our reach, within the reach of my lifetime。你不可能不 romantic about that。多麼 exciting time to be alive。

reasonable thing to expect the end of disease, pollution drastically reduced, traveling at the speed of light actually in our future。很快,他將 put a humanoid on a spaceship, send it out as soon as possible,它將 keep improving and enhancing along the flight。當時候到了,他所有的 consciousness 已經 uploaded in the internet。 take all my inbox, everything I've done, everything I've said, collected and becoming my AI。當時候到了, send that at the speed of light, catch up with my robot。

understanding the biological machine is right around the corner,不是10年, probably five years。 explaining consciousness 會 awesome。所有這些 within our reach。

黃仁勳感謝Lex的所有採訪,深度、尊重和研究,揭示 amazing people。作為 innovator,創造了這種長形式 unbelievable and captivating 的内容。感謝他所做的一切。

内容來源:TECHUB NEWS

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩内容,請點擊: 財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

Techub News

香港領先,世界一流的科技媒體平台 在數字化時代,Web3技術的崛起為媒體行業注入了新的活力。作為香港領先的Web3媒體平台,Techub News憑借其專業的團隊、豐富的資源和創新的業務模式,成為了行業内的佼佼者。Techub News,作為香港的科技媒體翹楚,致力於打造「香港領先,世界一流」的科技媒體和新媒體集群。Techub News平台提供最新、最快、最專業的Web3科技資訊,為用戶呈現科技前沿的無限魅力。

視頻

快訊

17:44
香港第一季港口貨物吞吐量同比上升2.2% 達4200萬公噸
17:40
香港4月零售業總銷貨價值臨時估計為314億元 同比上升8.6%
17:34
天成控股(02110.HK):聶政獲任執行董事
17:27
香港交易所與阿斯塔納國際金融中心及阿斯塔納國際交易所簽署合作備忘錄
17:20
正乾金融控股(01152.HK)因可換股債券獲行使發行约1.066億股
17:06
​益美國際控股(01870.HK):韶關電化學獨立儲能項目(二期)完成備案
16:54
奇士達(06918.HK)建議更名為「九泰數智科技控股有限公司」
16:46
中廣核電力(01816.HK)台山2號機組換料大修完成
16:32
摯文集團:2026年Q1淨營收23.86億元
16:20
【異動股】港股跌幅榜前十,連達科技控股(00889.HK)跌45.93%,新達控股(08471.HK)跌30.00%