「差生」特斯拉和「頭牌」Waymo,做自動駕駛有什麽不同?

日期:2019年3月25日 下午7:25

至于誰最終會在這場「曠日持久戰」中勝出,我們暫且不討論。今天想和大家聊聊關于特斯拉和 Waymo 在技術層面的一兩點差異。

資訊機構 Navigant Research 最近公布的報告再次將兩家公司推向風口浪尖。一個是在排名中墊底的特斯拉,另一個則是拔得頭籌的 Waymo。至于評判標准,是根據每家公司在「願景」、「商業化策略」、「合作方」、「量産計劃」、「技術」以及「産品持久力」這幾個方面的綜合表現打分排名。

2019 自動駕駛領導力排行榜,來源:Navigant Research

在去年的報告中,Waymo 和特斯拉的排名分別為第七位和第十二位。對 Waymo 而言,去年開始的大規模商業化試運營應該是其領先的重要原因。但特斯拉墊底就有點說不過去了,排名竟然比蘋果都低。在一些業内人士看來,這份報告在成文的視角和方法論上略有偏差,缺失了對「政府關系」和「數據」這兩個重要標准的考量。

和政府搞好關系的重要性自不必說。一旦硬件實現商品化,軟件就成了關鍵。實際上不能說是軟件,而是「數據」。數據是驅動自動駕駛技術發展的「燃料」,或者如前英特爾首席執行官 Brian Krzanich 提出的觀點,「數據是新的石油資源」。世界上最先進的人工智能也需要數據支持——它依靠浩如煙海的數據將信息傳化為下一步的行動。 

顯然,如果只考慮「科技」和「數據收集」這兩個維度,排在榜首的應該是 Waymo 和特斯拉。至于誰最終會在這場「曠日持久戰」中勝出,我們暫且不討論。今天想和大家聊聊關于特斯拉和 Waymo 在技術層面的一兩點差異性。

「貌合」「神離」的兩套方案

二月底,Waymo 首席科學家 Drago Anguelov 在 MIT 首次開講,他分享的内容主題為「解決自動駕駛中的長尾問題」(Taming The Long Tail of Autonomous Driving Challenges),這應該是外界對 Waymo 自動駕駛研發目前能夠了解到的最深度、最詳細的内容了。

Waymo 首席科學家 Drago Anguelov 在 MIT 開講自動駕駛課程

近些年,使用大量標注過的數據對深度學習網絡進行監督訓練,使得物體感知和行為預測能力有了大幅提升,這些技術在 Waymo 自動駕駛開發過程中得到了大規模應用。我們也從 Drago Anguelov 口中第一次知道了 Waymo 在使用「模仿學習(imitation learning)」,這里先稍微科普一下。

模仿學習屬于機器學習的一種,它的神經網絡能夠通過「觀察」人類的行為將某些特定的動作和場景進行匹配。如果使用不同類型的「人類行為」作為數據源來訓練,最終神經網絡就能夠根據感知的結果輸出相對應的決策動作。例如,「如果你看到停車標志,馬上停車」、「如果前方有輛停著的車擋路了,繞開它」等等。

「行為克隆」(behaviour cloning)與「模仿學習」(imitation)是一回事

隨著商業化試運營的推進,谷歌能夠采集數據的場景更多了,模仿學習算法也就有了更頻繁的用處。但 Drago Anguelov 也指出,人類駕駛行為存在著很多不確定性,一些罕見的場景(所謂的「長尾」問題),Waymo 的數據集中並沒有足夠的案例來訓練算法應對。出現這種情況就只能依靠開發人員手動編寫算法。Drago 認為這種「折中」的做法遲早是會被機器學習代替的。

根據 Waymo 官方披露的數據,Waymo 目前已經累積了約 1500 萬英里的行駛里程。按照平均每 3000 萬英里才會出現一起事故的概率來計算的話,Waymo 可能到現在都沒有得到一個特定的「長尾」案例。假設行駛每 100 萬英里會發生一起事故,waymo 也不過積累了 15 個數據而已。按照普通機器學習神經網絡需要的數據量(每個圖像分類需要至少 1000 個樣本)的標准來看,Waymo 似乎還差得有些遠。

盡管 Drago Anguelov 表示希望通過采集盡可能多的人類駕駛行為(包括「長尾」案例)來進行模仿學習,但「數據量的缺失」是個很大的問題。

而為了彌補這方面的缺陷,Waymo 已經構建出了一套仿真模型,仿真出盡可能多的場景來進行測試。因為有時會得出截然相反的結果,所以要加強系統的魯棒性,做出足夠多的仿真模型,確保系統的准確性。

仿真測試是自動駕駛研發中的關鍵一環

不過仿真模型的建立依然需要真實世界數據的支持,解決「長尾」問題也需要對人類駕駛行為進行大量地模仿學習。所以這就又回到了問題的原點,Waymo還需要更大量級「數據」的支持。

對比之下,似乎「差生」特斯拉在「數據」問題上還真是不發愁。

特斯拉目前預計有超過 40 萬輛搭載了 Autopilot 系統的車子在道路上行駛,單日行駛里程超過了 1300 萬英里。如果未來這個車隊的規模增加至超過 100 萬輛,那麽每月産生的有效行駛里程將到達 10 億英里的量級。對一家已經有成熟産品落地的車企而言,這種真實世界産生的「數據」根本不是問題。

特斯拉 Model 3

至于特斯拉在自動駕駛研發上的獨特性,根據外媒 The Information 曾經透露的信息,特斯拉同樣在利用「里程累積」上的優勢進行模仿學習。原文是這麽說的:

據熟悉特斯拉這套系統的線人爆料稱,特斯拉的車子在行駛過程中會將攝像頭及其他傳感器的數據搜集起來,Autopilot 是否運行並沒有關系。之後工程師可以將這些數據中人類的駕駛行為與不同的場景進行匹配,之後遇到類似的場景機器就可以模仿人類去執行。比如怎樣拐彎或躲避障礙物。當然這種被叫做「行為克隆」的方法也有局限性,但特斯拉的工程師認為只要有足夠的數據支撐,神經網絡就能夠給出正確的決策結果,例如在絕大多數場景中如何轉向、刹車以及加速。在特斯拉看來,未來不再需要人類手動編程控制無人車應對特定場景。

不過按照個人的理解,特斯拉軟件工程師提到的「行為克隆」和 Waymo 的「模仿學習」是一個意思,等同于大家都在講的「端到端學習」的方案,即使用一個巨大的神經網絡,輸入傳感器數據後得到關于轉向、加速和刹車的整體執行策略。

假設特斯拉采用的是端到端學習方案,那它肯定是不需要對圖像進行標記的。唯一需要「標記」的是人類駕駛員的行為,比如轉向角是多少、加減速的力度等。將整個傳感器數據輸入到一個巨大的神經網絡後,系統會學習如何將傳感器數據與人類駕駛員的行為進行匹配。但我們知道特斯拉是在做圖片標記的,所以從這一點出發考慮,它采用的就不大可能是和 Waymo 一樣的「端到端學習」的策略。

「端到端」與「語義抽象」的差異

針對自動駕駛感知的算法差異,Mobileye 創始人 Amnon Shashua 曾經對「端到端學習 (End-to-End Learning)」和「語義抽象(Semantic Abstraction)」這兩個概念做過詳細的講解。

Mobileye 創始人 Amnon Shashua 對自動駕駛感知的内容進行了講解

而根據外媒 The Information 報道的内容來推斷,特斯拉可能是在開發一套用于路徑規劃或執行控制的神經網絡。而用來訓練這套神經網絡的數據並非來自傳感器,而是由感知神經網絡輸出的元數據。這樣人類駕駛員的直接行為—轉向、加速和刹車可以對元數據進行「標記」,類似端到端學習中,駕駛行為與傳感器數據的匹配。

這種將感知層和執行層神經網絡分開的做法能夠規避 Shashua 教授上面提到的端到端學習可能産生的一系列問題:如「不常見場景」出現的幾率會大幅下降;對先備知識(Prior Knowledge)的要求提高,深度神經網絡在解決一些簡單問題上可能會「慘敗」。

「端到端」機器學習的局限性

假設特斯拉用于訓練的數據來自特斯拉車主,通過人工的方式將一些「壞的」行為去掉,這樣可以避開人工編碼算法的局限和模擬測試的不真實。當然特斯拉還可以使用強化學習或監督學習來進一步優化。可以把路徑規劃或執行控制的神經網絡放在運行 Autopilot 或其他駕駛輔助功能的車子上,一旦出現系統脫離、失效、碰撞等情況,工程師就可以通過 bug 報告來定位原因。這些「錯誤」之後還可以用來訓練新的神經網絡。

如果上面猜測正確的話,這種方法可以用相當快的速度來解決路徑規劃和執行控制方面的問題。考慮到目前搭載硬件 2.0 版本的特斯拉車型每個月可以獲得近 10 億英里的行駛里程,獲得的數據量之大是 Waymo 無法企及的。之後硬件 3.0 版本上線後,搭載了 AI 芯片的這套系統會更有利于特斯拉算法的叠代。

一場馬拉松式的長跑

盡管Waymo深受「數據」的困擾,但光憑對這個維度的考量自然是沒辦法斷言什麽的。只不過Waymo要解決自動駕駛中的「長尾」問題,自然需要更多的數據支持。Waymo近日宣布將在亞利桑那州的梅薩市開設新的技術服務中心,進一步擴大無人車出行服務的規模。顯然Waymo是奔著搜集更多「數據」的目的來的。

基于克萊斯勒 Pacifica 車型打造的 Waymo 自動駕駛原型車

也有人認為,Waymo可以效仿特斯拉開發一套類似Autopilot的駕駛輔助系統,僅使用成本低廉可量産的傳感器。一旦在市場鋪開後,搜集真實場景的駕駛數據也就不是什麽難事了。當然,Waymo自己要完成這件事比較困難,肯定需要來自主機廠領域的合作夥伴。

上周有消息稱,「Waymo正在尋求外部投資人」。意料之中的計劃。如果有車企成為Waymo的股東,要獲得海量的駕駛數據自然容易得多。而且Waymo作為自動駕駛解決方案的供應商,始終只有借助OEM的平台才能最終獲得商業化成功。不管是手中的全棧自動駕駛技術亦或是正在進行的移動出行業務,Waymo對很多車企而言,都是有十足吸引力的合作夥伴。Cruise和通用、福特與Argo.AI,這些都是比較成功的先例。

對特斯拉而言,之前因為Model 3陷入「量産地獄」,Autopilot的研發進程似乎出現了停滯,硬件3.0也遲遲沒有發布。盡管在「數據」容量上有先天優勢,但率先量産以及頻發的幾次事故使其屢陷輿論風波。所以,特斯拉在自動駕駛上到底能有怎樣的成就,還在還很難說。

特斯拉創始人 Elon Musk 首次發布 Autopilot 系統

不過我個人倒是蠻欣賞之前馬斯克說過的一段話。

他說,「我不認為哪家企業能在特斯拉之前打造出一套綜合性的自動駕駛解決方案。除非它們保密工作做得太好了,到時候要拿出驚人的成果來。我覺得這種可能性不大,對特斯拉而言,任何車企都不是我們的競爭對手」。

希望這種「目中無人」的狂妄自大,可以給特斯拉帶來點好運氣。

責任編輯 臥蟲

圖片來源 視覺中國、特斯拉官方、演講視頻截圖

 

 

 

 

 

 

 

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩內容,請登陸
財華香港網 (https://www.finet.hk)
現代電視 (http://www.fintv.com)

相關文章

3月19日
英偉達 GTC2019 :面對「數據信仰」的 AI 時代,只有 GPU 並不能贏
3月15日
蘋果 WWDC 定檔 6 月 3-7 日;小米叫停小米 9 發售並致歉;賈躍亭 FF 工廠 4000 萬美元賣地 | 極客早知道
3月15日
7 座 Model Y 發布,馬斯克的 SEXY 沒有「意外」
3月14日
拼多多發 18 年財報:虧損 39 億;馬化騰打賞「露露事件」原作者;北京監管部門約談外賣平台 | 極客早知道
3月11日
阿里巴巴 46.6 億元入股申通快遞;華住集團就低俗營銷推送道歉;華為起訴最新進展:美國法院已給美國政府發傳票 | 極客早知道