DeepSeek開源加速理想9個月 李想:我們?nèi)詧猿肿匝谢P?/h1>
快訊
2025年05月17日 20:30 2
admin

鳳凰網(wǎng)科技訊 5月17日,理想汽車創(chuàng)始人李想近日在“理想AI Talk第二季”中,詳細闡述了他對當前人工智能發(fā)展趨勢的觀察以及理想汽車在智能駕駛和AI領(lǐng)域的布局。他指出,在距離上次AI對話約130天的時間里,最令他高興的是看到整個中國的進步,包括DeepSeek、千問等國內(nèi)模型已將中國在基座模型、推理和多模態(tài)方面的水平基本拉近或與美國處在同一水平線上。
李想認為,中國企業(yè)在模型效率方面做得更好,進行了深層工程改造,這增強了行業(yè)的信心。他特別提到,DeepSeek V3的混合專家模型(MoE)架構(gòu)(671B參數(shù))及其極簡地運用“人類最佳實踐”(研究-研發(fā)-表達能力-業(yè)務(wù)價值)的做法,令他受益匪淺。
李想坦承,盡管AI技術(shù)發(fā)展迅猛,但他個人的工作時長并未減少,反而在增加。他認為主要原因是,大多數(shù)人目前仍將AI視為一種信息工具。這種工具依賴聯(lián)網(wǎng)搜索和檢索增強生成(RAG),但信息源本身可能存在失真和不準確,導致推理過程和結(jié)果出現(xiàn)問題,甚至增加無效信息(熵增)。
他將AI工具分為三類:信息工具、輔助工具和生產(chǎn)工具。只有當AI真正成為生產(chǎn)工具,能夠替代人類完成專業(yè)工作、解決最核心的8小時工作時間、產(chǎn)生有效生產(chǎn)力時,AI的價值才能真正爆發(fā)。他認為,未來的Agent(智能體)不會是通用的,而是每個專業(yè)領(lǐng)域都會有專業(yè)的Agent,因為不同領(lǐng)域的語料、行動和思維鏈是完全不同的。
對于DeepSeek的出現(xiàn),李想給予了高度評價。他透露,DeepSeek的開源對理想汽車的自動駕駛研發(fā)產(chǎn)生了巨大幫助,特別是VLA模型中的語言(L)部分,加速了大約9個月的時間。正是因為DeepSeek帶來了如此大的收益和幫助,理想汽車決定將自研了四年的整車操作系統(tǒng)理想星環(huán)OS開源,這是一種對社會的貢獻和感謝,并非出于公司戰(zhàn)略,而是源于一種樸素的情懷。
盡管擁抱了DeepSeek,但李想強調(diào),理想汽車不僅沒有放棄自研基座模型團隊,反而加大了投入,僅訓練卡采購量就比今年的預期多買了3倍。他解釋說,這是因為理想汽車的業(yè)務(wù)場景特殊,車載環(huán)境需要針對性的基座模型,包括3D視覺、高清2D視覺(分辨率提升10倍)、交通/駕駛/家庭領(lǐng)域?qū)I(yè)語料,以及視覺與語言聯(lián)合語料。這些數(shù)據(jù)和場景是通用大模型所不具備的。理想汽車目前正在訓練不同規(guī)模的模型,例如用于車載智能助手(理想同學)的約3000億參數(shù)模型,以及用于輔助駕駛VLA視覺語言部分的320億參數(shù)模型。
李想將理想汽車的智能駕駛發(fā)展劃分為三個階段:從規(guī)則算法階段(昆蟲智能),到端到端+VLM階段(哺乳動物智能),最終邁入VLA(視覺、語言、行動模型)階段(人類智能)。他將車載VLA稱為“司機大模型”,目標是像人類司機一樣工作。他認為,交通領(lǐng)域是實現(xiàn)VLA的最佳實驗場,因為規(guī)則清晰、環(huán)境確定、車輛控制自由度相對較低,便于模仿學習和強化學習。VLA的訓練流程復雜而系統(tǒng)化,包括預訓練VL基座(整合多源數(shù)據(jù),蒸餾到端側(cè))、后訓練加入行動模塊(模仿駕駛行為)、以及強化訓練(通過人類反饋和世界模型訓練,追求超越人類的平均駕駛水平)。
針對VLA將行動引入物理世界帶來的安全問題,理想汽車專門組建了百人規(guī)模的“超級對齊”團隊。這個團隊的核心任務(wù)是確保即使模型能力很強,也能像一個職業(yè)司機一樣,遵守交通規(guī)則、符合人類駕駛習慣、保證安全和舒適性,避免出現(xiàn)激進或不安全的行為。李想認為,這就像雇傭職業(yè)司機一樣,除了駕駛技術(shù),更重要的是其“職業(yè)性”,即價值觀對齊。此外,為解決模型黑盒問題和提高驗證效率,理想汽車構(gòu)建了基于重建和生成的交通世界模型,可以在虛擬環(huán)境中模擬真實場景,進行高效、可重復的測試和問題解決。
李想表示,邁向VLA無法跳過端到端等前期積累,“無法直接吃第十個包子”。他強調(diào)扎實的基本功在AI時代尤為重要。理想汽車自2021年開始自研輔助駕駛,在操作系統(tǒng)、訓練體系、底層芯片軟件優(yōu)化等方面都進行了深入投入。他認為理想的智駕在原創(chuàng)性上甚至超過了增程技術(shù)。面對行業(yè)競爭,他認為應(yīng)學習頂尖公司的基本功,因為在AI時代,能力強的公司能很快復制創(chuàng)新,基礎(chǔ)扎實才能應(yīng)對挑戰(zhàn)。盡管VLA是目前能力最強、最接近人類駕駛的架構(gòu),李想對其是否是效率最高的終極架構(gòu)持開放態(tài)度。他也指出,對于ETC收費站這類確定性場景,使用規(guī)則算法比純模型更高效、準確且成本更低。
回顧創(chuàng)業(yè)歷程,李想認為最深刻的記憶是理想ONE和理想L9的成功發(fā)布,但也經(jīng)歷過產(chǎn)品發(fā)布后的低谷和質(zhì)疑。他選擇將這些困難視為成長的機會,并盡可能只保留有價值的美好記憶,以保持正能量。
在個人成長和能量方面,李想認為關(guān)鍵在于關(guān)注人,尤其是親密關(guān)系,接受自己和別人的優(yōu)點與不足,通過持續(xù)的成長來獲取和傳遞能量。他看到了家人和團隊的成長帶來的巨大能量,并認為AI應(yīng)幫助人類有更多時間與“萬物”接觸,獲取智慧。最后,他表示AI時代應(yīng)保留人性的所有特質(zhì),無論好壞,因為它們共同構(gòu)成了生命的活力。
相關(guān)文章
-
詳細閱讀
-
詳細閱讀
-
開源門戶網(wǎng)站排名,探索自由軟件的互聯(lián)網(wǎng)領(lǐng)航者,自由軟件領(lǐng)航,開源門戶網(wǎng)站權(quán)威排名揭曉,2023開源門戶網(wǎng)站權(quán)威排名,自由軟件領(lǐng)航者的互聯(lián)網(wǎng)圖譜
開源門戶網(wǎng)站排名,揭示自由軟件領(lǐng)域的互聯(lián)網(wǎng)領(lǐng)航者。本文深入剖析各大開源網(wǎng)站,為您提供全面的開源軟件信息,助力您發(fā)現(xiàn)、使用和貢獻自由軟件。...
2025-04-04
16
開源
門戶網(wǎng)站
領(lǐng)航
詳細閱讀
-
詳細閱讀
-
詳細閱讀
-
詳細閱讀
鳳凰網(wǎng)科技訊 5月17日,理想汽車創(chuàng)始人李想近日在“理想AI Talk第二季”中,詳細闡述了他對當前人工智能發(fā)展趨勢的觀察以及理想汽車在智能駕駛和AI領(lǐng)域的布局。他指出,在距離上次AI對話約130天的時間里,最令他高興的是看到整個中國的進步,包括DeepSeek、千問等國內(nèi)模型已將中國在基座模型、推理和多模態(tài)方面的水平基本拉近或與美國處在同一水平線上。
李想認為,中國企業(yè)在模型效率方面做得更好,進行了深層工程改造,這增強了行業(yè)的信心。他特別提到,DeepSeek V3的混合專家模型(MoE)架構(gòu)(671B參數(shù))及其極簡地運用“人類最佳實踐”(研究-研發(fā)-表達能力-業(yè)務(wù)價值)的做法,令他受益匪淺。
李想坦承,盡管AI技術(shù)發(fā)展迅猛,但他個人的工作時長并未減少,反而在增加。他認為主要原因是,大多數(shù)人目前仍將AI視為一種信息工具。這種工具依賴聯(lián)網(wǎng)搜索和檢索增強生成(RAG),但信息源本身可能存在失真和不準確,導致推理過程和結(jié)果出現(xiàn)問題,甚至增加無效信息(熵增)。
他將AI工具分為三類:信息工具、輔助工具和生產(chǎn)工具。只有當AI真正成為生產(chǎn)工具,能夠替代人類完成專業(yè)工作、解決最核心的8小時工作時間、產(chǎn)生有效生產(chǎn)力時,AI的價值才能真正爆發(fā)。他認為,未來的Agent(智能體)不會是通用的,而是每個專業(yè)領(lǐng)域都會有專業(yè)的Agent,因為不同領(lǐng)域的語料、行動和思維鏈是完全不同的。
對于DeepSeek的出現(xiàn),李想給予了高度評價。他透露,DeepSeek的開源對理想汽車的自動駕駛研發(fā)產(chǎn)生了巨大幫助,特別是VLA模型中的語言(L)部分,加速了大約9個月的時間。正是因為DeepSeek帶來了如此大的收益和幫助,理想汽車決定將自研了四年的整車操作系統(tǒng)理想星環(huán)OS開源,這是一種對社會的貢獻和感謝,并非出于公司戰(zhàn)略,而是源于一種樸素的情懷。
盡管擁抱了DeepSeek,但李想強調(diào),理想汽車不僅沒有放棄自研基座模型團隊,反而加大了投入,僅訓練卡采購量就比今年的預期多買了3倍。他解釋說,這是因為理想汽車的業(yè)務(wù)場景特殊,車載環(huán)境需要針對性的基座模型,包括3D視覺、高清2D視覺(分辨率提升10倍)、交通/駕駛/家庭領(lǐng)域?qū)I(yè)語料,以及視覺與語言聯(lián)合語料。這些數(shù)據(jù)和場景是通用大模型所不具備的。理想汽車目前正在訓練不同規(guī)模的模型,例如用于車載智能助手(理想同學)的約3000億參數(shù)模型,以及用于輔助駕駛VLA視覺語言部分的320億參數(shù)模型。
李想將理想汽車的智能駕駛發(fā)展劃分為三個階段:從規(guī)則算法階段(昆蟲智能),到端到端+VLM階段(哺乳動物智能),最終邁入VLA(視覺、語言、行動模型)階段(人類智能)。他將車載VLA稱為“司機大模型”,目標是像人類司機一樣工作。他認為,交通領(lǐng)域是實現(xiàn)VLA的最佳實驗場,因為規(guī)則清晰、環(huán)境確定、車輛控制自由度相對較低,便于模仿學習和強化學習。VLA的訓練流程復雜而系統(tǒng)化,包括預訓練VL基座(整合多源數(shù)據(jù),蒸餾到端側(cè))、后訓練加入行動模塊(模仿駕駛行為)、以及強化訓練(通過人類反饋和世界模型訓練,追求超越人類的平均駕駛水平)。
針對VLA將行動引入物理世界帶來的安全問題,理想汽車專門組建了百人規(guī)模的“超級對齊”團隊。這個團隊的核心任務(wù)是確保即使模型能力很強,也能像一個職業(yè)司機一樣,遵守交通規(guī)則、符合人類駕駛習慣、保證安全和舒適性,避免出現(xiàn)激進或不安全的行為。李想認為,這就像雇傭職業(yè)司機一樣,除了駕駛技術(shù),更重要的是其“職業(yè)性”,即價值觀對齊。此外,為解決模型黑盒問題和提高驗證效率,理想汽車構(gòu)建了基于重建和生成的交通世界模型,可以在虛擬環(huán)境中模擬真實場景,進行高效、可重復的測試和問題解決。
李想表示,邁向VLA無法跳過端到端等前期積累,“無法直接吃第十個包子”。他強調(diào)扎實的基本功在AI時代尤為重要。理想汽車自2021年開始自研輔助駕駛,在操作系統(tǒng)、訓練體系、底層芯片軟件優(yōu)化等方面都進行了深入投入。他認為理想的智駕在原創(chuàng)性上甚至超過了增程技術(shù)。面對行業(yè)競爭,他認為應(yīng)學習頂尖公司的基本功,因為在AI時代,能力強的公司能很快復制創(chuàng)新,基礎(chǔ)扎實才能應(yīng)對挑戰(zhàn)。盡管VLA是目前能力最強、最接近人類駕駛的架構(gòu),李想對其是否是效率最高的終極架構(gòu)持開放態(tài)度。他也指出,對于ETC收費站這類確定性場景,使用規(guī)則算法比純模型更高效、準確且成本更低。
回顧創(chuàng)業(yè)歷程,李想認為最深刻的記憶是理想ONE和理想L9的成功發(fā)布,但也經(jīng)歷過產(chǎn)品發(fā)布后的低谷和質(zhì)疑。他選擇將這些困難視為成長的機會,并盡可能只保留有價值的美好記憶,以保持正能量。
在個人成長和能量方面,李想認為關(guān)鍵在于關(guān)注人,尤其是親密關(guān)系,接受自己和別人的優(yōu)點與不足,通過持續(xù)的成長來獲取和傳遞能量。他看到了家人和團隊的成長帶來的巨大能量,并認為AI應(yīng)幫助人類有更多時間與“萬物”接觸,獲取智慧。最后,他表示AI時代應(yīng)保留人性的所有特質(zhì),無論好壞,因為它們共同構(gòu)成了生命的活力。
相關(guān)文章
- 詳細閱讀
- 詳細閱讀
-
開源門戶網(wǎng)站排名,探索自由軟件的互聯(lián)網(wǎng)領(lǐng)航者,自由軟件領(lǐng)航,開源門戶網(wǎng)站權(quán)威排名揭曉,2023開源門戶網(wǎng)站權(quán)威排名,自由軟件領(lǐng)航者的互聯(lián)網(wǎng)圖譜詳細閱讀
開源門戶網(wǎng)站排名,揭示自由軟件領(lǐng)域的互聯(lián)網(wǎng)領(lǐng)航者。本文深入剖析各大開源網(wǎng)站,為您提供全面的開源軟件信息,助力您發(fā)現(xiàn)、使用和貢獻自由軟件。...
2025-04-04 16 開源 門戶網(wǎng)站 領(lǐng)航
- 詳細閱讀
- 詳細閱讀
- 詳細閱讀
最新評論