李想反思:理想汽車回歸創(chuàng)業(yè)模式,押注“具身智能汽車”路線
關鍵詞: 理想汽車 長期戰(zhàn)略 組織變革 創(chuàng)業(yè)模式 具身智能
理想汽車昨日公布第三季度財報,在隨后的業(yè)績電話會上,理想汽車創(chuàng)始人李想發(fā)表了關于公司面向第二個十年的長期戰(zhàn)略思考。面對行業(yè)競爭與技術變革,李想明確了組織、產(chǎn)品、技術三大維度的關鍵轉型:
組織變革:堅定回歸“創(chuàng)業(yè)公司”管理模式
李想反思過去三年推行“職業(yè)經(jīng)理人”體系在應對劇烈變化時的局限性。
宣布自今年四季度起,放棄職業(yè)經(jīng)理人模式,回歸創(chuàng)業(yè)公司管理模式。
產(chǎn)品重塑:拒絕參數(shù)內(nèi)卷,定義“具身智能機器人”
指出單純比拼續(xù)航里程的“電動車”邏輯和重復建設手機功能的“智能終端”邏輯均為研發(fā)浪費。
未來十年的產(chǎn)品核心是具身智能機器人,強調產(chǎn)品需具備“自動”和“主動”服務能力,如主動接駕、生活照料等,實現(xiàn)從被動機器向主動機器人的質變。
技術路徑:自研M100芯片,構建完整AI系統(tǒng)
明確具身智能與語言智能的系統(tǒng)差異,強調端側算力與物理世界感知的精準性。
披露核心技術布局:采用3D ViT感知模型(有效距離擴大2-3倍)和自研M100芯片。
通過線控體系改造,計劃將從感知到執(zhí)行的響應速度從550毫秒提升至350毫秒,大幅降低事故率。
戰(zhàn)略目標
未來3-5年內(nèi),致力于讓理想汽車成為具身智能領域用戶價值最高、表現(xiàn)最好的企業(yè)。
以下為李想業(yè)績會發(fā)言全文:
大家好,我是李想。
2025 年的第三季度,也是理想汽車面向第二個十年的第一個季度,我們經(jīng)歷了產(chǎn)品周期、公關輿情、供應鏈爬產(chǎn)、政策變化等問題帶來的各種挑戰(zhàn),這些因素對我們的交付和經(jīng)營也產(chǎn)生了影響,但是今天更想和大家聊一聊我們長期的思考,理想汽車面向第二個十年,三個最重要的關鍵選擇應該怎么做?分別是組織、產(chǎn)品、技術。
第一個關鍵選擇是組織,我們所面臨的選擇是創(chuàng)業(yè)公司的管理模式還是職業(yè)經(jīng)理人的管理模式?
理想汽車在過去的十年里,最初的 7 年是創(chuàng)業(yè)公司的管理模式,隨著規(guī)模的擴大,到了我之前創(chuàng)業(yè)所沒有經(jīng)歷過的營收規(guī)模。在 2022 年前后,很多人都會建議我們走向職業(yè)經(jīng)理人的管理模式。因為在歷史上,奔馳、寶馬這樣的百年汽車企業(yè),以及微軟、蘋果這樣的科技巨頭都在這一模式下取得了非常大的成功,過去三年我們非常努力的讓自己變成職業(yè)經(jīng)理人的治理體系,在真實的體驗和落地后,我們認識到創(chuàng)業(yè)公司和職業(yè)經(jīng)理人是兩種完全不同的治理體系,它與流程、組織結構無關,而是管理理念和要素的差異以及各自適用于不同階段和行業(yè)環(huán)境。
職業(yè)經(jīng)理人的管理方式可以非常成功,但是需要三個要素:第一,行業(yè)和技術周期相對穩(wěn)定。第二,企業(yè)的行業(yè)地位領先且穩(wěn)固。第三,創(chuàng)始人和創(chuàng)業(yè)團隊要么沒有動力干了,要么已經(jīng)不在了。如果滿足這些條件,職業(yè)經(jīng)理人的管理模式是非常好的選擇。蘋果和微軟也都在職業(yè)經(jīng)理人接班后,從千億美金成長為萬億美金的企業(yè)。
而創(chuàng)業(yè)公司的條件恰恰相反:第一,行業(yè)和技術周期在發(fā)生巨大的變化。第二,行業(yè)格局不確定,企業(yè)還不是領先者。第三,創(chuàng)始人和創(chuàng)業(yè)團隊每天還在投入地努力工作,充滿動力。在人工智能重塑各個行業(yè)的今天,我們所處的環(huán)境,我們自身的特點更符合創(chuàng)業(yè)公司的條件。
創(chuàng)業(yè)公司的管理的核心是四件事:
更多的對話,深度的對話,而非更多的匯報。 在高度變化中,深度的對話是提升認知和大膽決策的關鍵要素。
聚焦用戶價值,而非只是交付。 對用戶真正有價值的東西才值得交付,而不僅僅是完成各種交付的任務。
持續(xù)提升效率,而非占有更多的資源。 去年花 10 塊錢做的事情,今年就要花 8 塊錢去做,從而才有更多的資源去做短期不創(chuàng)造收入的長期投資和能力建設。
要識別關鍵問題,而不是創(chuàng)造信息不對稱。 只有價值增加了,效率提升了,關鍵問題解決了,才可以在高度競爭、高度變化的環(huán)境中持續(xù)滿足用戶的需求。
過去三年,我和創(chuàng)業(yè)團隊努力學習職業(yè)經(jīng)理人的管理體系,逼迫自己接受各種變化,但是我們卻變得變成了越來越差的自己。而英偉達和特斯拉今天仍以創(chuàng)業(yè)公司的方式管理。如果全世界最強的那些公司都可以使用創(chuàng)業(yè)公司的管理方式,我們有什么理由放棄自己最擅長的方式?從 1998 年開始,我有 27 年的創(chuàng)業(yè)公司的管理經(jīng)驗,而且從來沒有在任何大企業(yè)中以職業(yè)經(jīng)理人的方式工作過,當下面對的又是一個行業(yè)高度競爭,技術高度變化的大環(huán)境,我自己熱愛汽車,熱愛產(chǎn)品,熱愛人工智能,工作就是自己最大的愛好,為什么不用自己最擅長的能力和方式來管理想汽車?
這是理想汽車面向第二個十年第一重要的選擇。因此從今年四季度開始,我們堅定地回到創(chuàng)業(yè)公司的管理模式,以此來面對新時代、新技術的挑戰(zhàn)。
組織的選擇是一切的基礎,進入新的十年,更關鍵的問題是我們真正要為用戶解決什么問題?產(chǎn)品是什么?技術往哪里走?這是永恒不變的本質。
首先關于產(chǎn)品,我們同樣要做一個選擇,面向未來十年,我們的產(chǎn)品到底是什么?是電動車?是智能終端還是具身機器人?
當產(chǎn)品停留在電動車,競爭的邏輯就會變成參數(shù)大戰(zhàn),續(xù)航多 20 公里還是少 20 公里,車長多兩厘米還是少兩厘米,如果只是電動車的競爭就是更大的空間,更多的續(xù)航,更便宜的價格。順便 copy 一下已經(jīng)被驗證成功的那些設計,比如理想L9。所有除此之外的研發(fā)投入都是研發(fā)成本的浪費,更強的傳感器、更強的模型、更強的算力、更強的主動懸架,都是整車成本的浪費,甚至性能強大的算力和主動懸架等產(chǎn)生的能耗還會給續(xù)航帶來負面效應。
如果我們選擇做智能終端,就會更加關注屏幕里的那些事,本能地變成智能手機功能的重復建設。過去幾年行業(yè)在智能終端上大部分創(chuàng)新都是這種邏輯,本質上是把智能手機的功能搬到車上,把手機的 APP 放到車機里,把更大的語言模型上到車里,甚至希望能夠在車里做 coding,在車里做 deep research。用戶買車到底是為了工作還是為了更好的生活?明明在手機和電腦上有更好的體驗、更自然的應用,為什么非要放在車上?這些投入對于用戶的價值提升非常有限,甚至是企業(yè)的自娛自樂。
我們還可以讓車變成物理世界的具身智能產(chǎn)品。說白了就是機器人,變形金剛的動畫片和電影明確地告訴我們,機器人最大的分類就是兩種形式,一種像人一樣,一種像車一樣。霹靂游俠和賽車總動員也清晰地告訴我們,汽車是機器人的核心形態(tài)之一,如何把車變成機器人,給它眼睛和耳朵的感知能力,給它大腦和神經(jīng)的模型能力,給它心臟等器官一樣的計算能力,改造硬件,形成更強的本體能力。
讓汽車機器人具備頂級司機的能力,不僅可以開車,還可以每天迎接你,幫你停車、幫你充電,給你開關車門,無微不至地為你提供便捷體驗和關懷。它還可以扮演父母助理、乘務員的角色,在車內(nèi)給你提供最便捷的生活服務和空間照顧,就像飛機的頭等艙服務,就像小時候媽媽一直在我們身邊的照顧和關懷。
如何定義一個好的具身機器人?從被動的機器成長為自動的機器,再進化為主動的機器人。未來 10 年,具身智能最有價值的產(chǎn)品,一定是具備自動和主動能力的。汽車產(chǎn)品的競爭也是自動和主動能力達到什么程度,而這些價值會融入高頻的生活和體驗中,有了就再也回不去了。
電動車的選擇不是不好,而是不夠。智能終端的選擇也不是不好,而是不夠。只有選擇具身智能這個最難的題,我們才可以真正改變用戶的生活,提供自動和主動服務的具身智能機器人產(chǎn)品。恰好它就是變形金剛的汽車形態(tài)機器人,是賽車總動員、霹靂游俠的汽車形態(tài)機器人。新時代給予汽車企業(yè)和創(chuàng)業(yè)者們最好的機遇和最高難度的挑戰(zhàn)。
接下來是技術的選擇,更具體的講是完整 AI 系統(tǒng)的技術選擇,是面向數(shù)字世界的語言智能,還是物理世界的具身智能?這意味著要構建完全不同的系統(tǒng)能力。
要想做好具身智能,最重要的是構建一套不同于語言智能的 AI 系統(tǒng),它包含具身智能的感知相當于眼睛和耳朵,具身智能的模型相當于大腦,具身智能的操作系統(tǒng)相當于神經(jīng)。具身智能的算力相當于心臟,具身智能的本體相當于人類的身體。當下沒有任何第三方供應商可以完整地提供這套系統(tǒng),甚至沒有任何一個是可以供應的。
語言智能最大的特點是關注好模型和計算,更大規(guī)模的模型、更大規(guī)模的計算就會帶來更強的能力,而具身智能必須增加對物理世界的感知,模型也是必須基于對物理世界的理解。精準是首要任務,其次才是泛化。操作系統(tǒng)需要確保軟硬的最優(yōu)融合,提高更高的幀率,整體系統(tǒng)要快和精準。為具身智能的感知模型、操作系統(tǒng)等提供的算力也需要在端側供應,而不是云端,最后還要改造硬件成為具身智能的本體,比如三維神經(jīng)控制的線控和主動液壓懸架系統(tǒng),提高本體執(zhí)行的效率和準確性。如果你理解具身智能整個IT、整個 AI 系統(tǒng),你發(fā)現(xiàn)可以改變以及急切需要改變的實在太多了。
首先是感知,基于現(xiàn)有的感知模型和端側的算力,現(xiàn)在的 3D Bev OCC 占用網(wǎng)絡 2D ViT 有效的感知距離,我講的是有效而非理論上最大只有 100 多米,遠遠不如人類的眼睛。如果升級成人眼,工作原理相似的 3D ViT 有效距離可以擴大 2 至 3 倍。今天我們輔助駕駛可能 50% 以上的常見問題自然就解決了。3D ViT 不僅限于自動駕駛的領域,在車外和車主的主動交互與服務,在車內(nèi)與家人的主動交互和服務也就變成了可能。這需要感知模型的研究和研發(fā)的重大突破,還必須有 M100 這樣的為具身智能定制設計的芯片和強大的編譯團隊高效配合才可以實現(xiàn)。
其次是模型,有了 3D ViT 才有了真正對物理世界的理解,VLA 模型中的 VL 才可以更好的對于物理世界的感知和理解。人類的數(shù)據(jù)才可以更高效地被用于訓練,視覺模型生成的數(shù)據(jù)才可以更好地去完善訓練現(xiàn)有最好的計算平臺。一個 4B 的 MOE 的模型運行幀率只有十赫茲,而執(zhí)行系統(tǒng)是六十赫茲。如果模型運行的幀率可以快 2 至 3 倍,現(xiàn)在輔助駕駛的一些舒適性的問題,反應遲鈍的問題都可以有效地解決,這同樣需要對傳統(tǒng)的 GPU 架構和算力進行深度的改造和定制,以及專有的操作系統(tǒng)。M100 芯片就是為解決具身智能這些本質的問題而研發(fā)的。
最后是本體,人類的剎車轉向的最快響應速度在 450 毫秒左右,目前自動駕駛的感知到執(zhí)行的完整鏈路在 550 毫秒左右,坐在駕駛員的位置上本能的反應就是慢很多,像老年人在開車,線控體系可以把整個鏈路的響應速度提升到 350 毫秒。別小看這 200 毫秒的差距,這大概可以把事故率下降 50% 以上,而且讓人感覺開得比自己還要好,還要安全。既是理性的真安全,又是感性的安全感。
基于這樣的需求,整個控制的方式都會變得完全不同。如果只是關注語言智能那樣的模型規(guī)模的提升,模型規(guī)模擴大一倍,算力提升帶來的性能提升只有 5% 到10%。如果從具身智能整體來看,每個環(huán)節(jié)全系統(tǒng)地去解決最關鍵的問題,那接下來一輪自動駕駛的性能提升應該有5-10倍。
具身智能為用戶提供的自動和主動的快速交互和真實服務的能力更是有和無的質變。過去三年,我們對于具身智能完整系統(tǒng)的技術儲備,讓我們下一代的產(chǎn)品充滿信心,具身智能機器人的元年從汽車機器人正式開啟,千億收入只是起步,以上三個關鍵的選擇決定了我們第二個十年發(fā)展的基礎,它比上一個十年更難,也更具挑戰(zhàn)性。我們深知未來的競爭不在一時一刻,而在方向的長期選擇和持續(xù)投入的定力。
依托堅實的財務基礎,我們會保持專注,用我們最熱愛的創(chuàng)業(yè)公司的管理模式,打造領先的具身智能產(chǎn)品,確保理想汽車能夠穿越周期,引領技術,成為一家長期為用戶和社會創(chuàng)造價值的企業(yè)。我也希望以后更多的以這樣的方式與投資人們進行溝通和交流,而不是每個季度以固定格式的匯報。感謝我們的投資人,在我們最難的時候仍然支持和信任我們。我們一定盡最大的努力,在未來的3-5年內(nèi),讓理想汽車成為具身智能領域表現(xiàn)最好的企業(yè)、用戶價值最高的企業(yè)。
謝謝。