自動駕駛圈又?叒叕“出”大事了!
今天一大早,在朋友圈和各種群里刷到這樣一條新聞:DriveGPT來了!
DriveGPT到底是個啥?百度搜一下。
(相關資料圖)
這才一天,已經爆了!百度搜索結果就沖到700萬了。然后是谷歌和Bing:
然后注意到這家外媒(這是火出漢語圈了呀)
看熱鬧怎么能不去Twitter……這里竟然也有人在討論DriveGPT
居然這位大叔圈了馬斯克,說:
有人比你們更快啊!
言外之意,這不是挑事么?
當然,估計有網友也想看看馬斯克同志能回個信~手動狗頭
吃了半天瓜,還是要言歸正傳,簡單回顧下這個事情。
首先,毫末是誰?
這家公司全名是毫末智行,是中國一家剛剛成立三年的自動駕駛獨角獸公司,有乘用車輔助駕駛和末端物流自動配送車等業務。在短時間內,就做到了中國量產自動駕駛第一名的位置。
這家公司很努力,兩年間就搞出了中國第一個自動駕駛數據智能體系,而且發展速度還特別快。
稍微關注這家公司的話,基本就是每三四個月迭代一次技術版本,交的作業還特別亮眼~
比如去年4月,毫末就在行業率先喊出了“重感知”的路線,其實就是特斯拉技術路線的中國版。不過,毫末的感知方案里還保留了“激光雷達”,搞一個雙冗余。
里面大篇幅提到了“Transformer”、“BEV感知”,這些概念后面承包了整個自動駕駛行業的新聞稿。
那么,DriveGPT又是啥?
DriveGPT,按毫末官方的說法,就是一個自動駕駛認知大模型,具體的叫法就是“人駕自監督認知大模型”。
字每個都認識,連起來就不知道啥意思了吧。
簡單來說,實現自動駕駛,分這么三步:
感知(看見東西)、認知(預測、決策、規劃)、控制執行
以往行業的關注點都是在感知層面,因為感知這一塊就已經夠難搞了,認知層面其實是更加難搞。
很多自動駕駛公司談到這塊都會隱晦不言。
那不如看看毫末是怎么說的吧
當前自動駕駛認知主要是靠傳統規則定義的算法來做決策規劃。但是這一方法進入瓶頸期,難以取得圖譜。特別是在馬上到來的復雜城市場景。
所以,毫末就開始嘗試使用人駕自監督大模型的方式來提升決策效果。
那么,毫末是怎么做的呢?——大致也分了三階段:
第一個階段,引入個別場景的端到端的模仿學習,直接擬合人駕行為;
第二個階段,通過認知大模型,引入海量正常人駕數據,通過Prompt的方式實現認知決策的可控、可解釋;
第三個階段,也就是毫末認知決策算法現在處于的階段,引入真實接管數據,并在大模型中開始使用RLHF(人類反饋強化學習)算法,讓模型學習人駕接管數據。
為啥要開始采用RLHF算法呢?
毫末CEO顧維灝說,用大模型去擬合海量人駕數據,會導致訓練出的模型傾向于擬合平均值,而非最優值,也就是練出一個普通司機的水平。
所以,第三階段,引入這個和ChatGPT采用同樣強化學習的RLHF技術,就是要去學習那些人類更好的駕駛策略,來優化自己的算法。
也就是說,當毫末認知決策算法通過擬合、學習人駕數據,具有一定的駕駛決策能力后,毫末構建了一個自動駕駛決策的獎勵模型(reward model),從而在各種規劃場景情況下做出最優的決策。
所以,毫末CEO顧維灝才會在今年1月AI DAY上,提到自家的認知大模型和ChatGPT思路不謀而合。現在想來,當時的判斷確實是比較有前瞻性的!
事實上,毫末最早在行業就布局研究Transformer大模型,現在又提前將ChatGPT技術納入自己的技術體系
所以,為啥是毫末搞出了DriveGPT!
其實就是天下武功,唯快不破!
那DriveGPT到底有多能打呢?恐怕還得期待今年4月份毫末的發布。
如果說,從毫末DriveGPT里學到點什么經驗呢?
我們可以從這個圖里找到答案!
每一次的技術飛躍,不就是一群技術狂人的孤注一擲嗎?
如果說一次技術革命必然有一個確定的結果的話,那恐怕這個世界會非常的無聊。
但正是一些難以企及的目標和一些敢為人先的勇氣,就會鞭策我們全力奔跑。
取乎其上,得乎其中……古人把生存的智慧早就寫好了。