特级毛片ww特级毛片w免费版,日本18中文字幕,日韩精品视频观看

當前位置：首頁> 行業資訊

熱頭條丨毫末DriveGPT大模型刷屏，有人問馬斯克：你慌不慌？

2023-02-18 00:01:04 來源：IT之家

自動駕駛圈又?叒叕“出”大事了！

今天一大早，在朋友圈和各種群里刷到這樣一條新聞：DriveGPT來了！

DriveGPT到底是個啥？百度搜一下。

(相關資料圖)

這才一天，已經爆了！百度搜索結果就沖到700萬了。然后是谷歌和Bing：

然后注意到這家外媒（這是火出漢語圈了呀）

看熱鬧怎么能不去Twitter……這里竟然也有人在討論DriveGPT

居然這位大叔圈了馬斯克，說：

有人比你們更快啊！

言外之意，這不是挑事么？

當然，估計有網友也想看看馬斯克同志能回個信~手動狗頭

吃了半天瓜，還是要言歸正傳，簡單回顧下這個事情。

首先，毫末是誰？

這家公司全名是毫末智行，是中國一家剛剛成立三年的自動駕駛獨角獸公司，有乘用車輔助駕駛和末端物流自動配送車等業務。在短時間內，就做到了中國量產自動駕駛第一名的位置。

這家公司很努力，兩年間就搞出了中國第一個自動駕駛數據智能體系，而且發展速度還特別快。

稍微關注這家公司的話，基本就是每三四個月迭代一次技術版本，交的作業還特別亮眼~

比如去年4月，毫末就在行業率先喊出了“重感知”的路線，其實就是特斯拉技術路線的中國版。不過，毫末的感知方案里還保留了“激光雷達”，搞一個雙冗余。

里面大篇幅提到了“Transformer”、“BEV感知”，這些概念后面承包了整個自動駕駛行業的新聞稿。

那么，DriveGPT又是啥？

DriveGPT，按毫末官方的說法，就是一個自動駕駛認知大模型，具體的叫法就是“人駕自監督認知大模型”。

字每個都認識，連起來就不知道啥意思了吧。

簡單來說，實現自動駕駛，分這么三步：

感知（看見東西）、認知（預測、決策、規劃）、控制執行

以往行業的關注點都是在感知層面，因為感知這一塊就已經夠難搞了，認知層面其實是更加難搞。

很多自動駕駛公司談到這塊都會隱晦不言。

那不如看看毫末是怎么說的吧

當前自動駕駛認知主要是靠傳統規則定義的算法來做決策規劃。但是這一方法進入瓶頸期，難以取得圖譜。特別是在馬上到來的復雜城市場景。

所以，毫末就開始嘗試使用人駕自監督大模型的方式來提升決策效果。

那么，毫末是怎么做的呢？——大致也分了三階段：

第一個階段，引入個別場景的端到端的模仿學習，直接擬合人駕行為；

第二個階段，通過認知大模型，引入海量正常人駕數據，通過Prompt的方式實現認知決策的可控、可解釋；

第三個階段，也就是毫末認知決策算法現在處于的階段，引入真實接管數據，并在大模型中開始使用RLHF（人類反饋強化學習）算法，讓模型學習人駕接管數據。

為啥要開始采用RLHF算法呢？

毫末CEO顧維灝說，用大模型去擬合海量人駕數據，會導致訓練出的模型傾向于擬合平均值，而非最優值，也就是練出一個普通司機的水平。

所以，第三階段，引入這個和ChatGPT采用同樣強化學習的RLHF技術，就是要去學習那些人類更好的駕駛策略，來優化自己的算法。

也就是說，當毫末認知決策算法通過擬合、學習人駕數據，具有一定的駕駛決策能力后，毫末構建了一個自動駕駛決策的獎勵模型（reward model），從而在各種規劃場景情況下做出最優的決策。

所以，毫末CEO顧維灝才會在今年1月AI DAY上，提到自家的認知大模型和ChatGPT思路不謀而合。現在想來，當時的判斷確實是比較有前瞻性的！

事實上，毫末最早在行業就布局研究Transformer大模型，現在又提前將ChatGPT技術納入自己的技術體系

所以，為啥是毫末搞出了DriveGPT！

其實就是天下武功，唯快不破！

那DriveGPT到底有多能打呢？恐怕還得期待今年4月份毫末的發布。

如果說，從毫末DriveGPT里學到點什么經驗呢？

我們可以從這個圖里找到答案！

每一次的技術飛躍，不就是一群技術狂人的孤注一擲嗎？

如果說一次技術革命必然有一個確定的結果的話，那恐怕這個世界會非常的無聊。

但正是一些難以企及的目標和一些敢為人先的勇氣，就會鞭策我們全力奔跑。

取乎其上，得乎其中……古人把生存的智慧早就寫好了。

標簽：強化學習這個事情技術革命

行業資訊

產品縱覽

海外資訊

招標信息