<ul id="seequ"><sup id="seequ"></sup></ul><tfoot id="seequ"></tfoot>
  • <tfoot id="seequ"><delect id="seequ"></delect></tfoot>
  • <ul id="seequ"></ul>
  • <small id="seequ"></small>

    熱頭條丨毫末DriveGPT大模型刷屏,有人問馬斯克:你慌不慌?

    2023-02-18 00:01:04 來源:IT之家

    自動駕駛圈又?叒叕“出”大事了!

    今天一大早,在朋友圈和各種群里刷到這樣一條新聞:DriveGPT來了!

    DriveGPT到底是個啥?百度搜一下。


    (相關資料圖)

    這才一天,已經爆了!百度搜索結果就沖到700萬了。然后是谷歌和Bing:

    然后注意到這家外媒(這是火出漢語圈了呀)

    看熱鬧怎么能不去Twitter……這里竟然也有人在討論DriveGPT

    居然這位大叔圈了馬斯克,說:

    有人比你們更快啊!

    言外之意,這不是挑事么?

    當然,估計有網友也想看看馬斯克同志能回個信~手動狗頭

    吃了半天瓜,還是要言歸正傳,簡單回顧下這個事情。

    首先,毫末是誰?

    這家公司全名是毫末智行,是中國一家剛剛成立三年的自動駕駛獨角獸公司,有乘用車輔助駕駛和末端物流自動配送車等業務。在短時間內,就做到了中國量產自動駕駛第一名的位置。

    這家公司很努力,兩年間就搞出了中國第一個自動駕駛數據智能體系,而且發展速度還特別快。

    稍微關注這家公司的話,基本就是每三四個月迭代一次技術版本,交的作業還特別亮眼~

    比如去年4月,毫末就在行業率先喊出了“重感知”的路線,其實就是特斯拉技術路線的中國版。不過,毫末的感知方案里還保留了“激光雷達”,搞一個雙冗余。

    里面大篇幅提到了“Transformer”、“BEV感知”,這些概念后面承包了整個自動駕駛行業的新聞稿。

    那么,DriveGPT又是啥?

    DriveGPT,按毫末官方的說法,就是一個自動駕駛認知大模型,具體的叫法就是“人駕自監督認知大模型”。

    字每個都認識,連起來就不知道啥意思了吧。

    簡單來說,實現自動駕駛,分這么三步:

    感知(看見東西)、認知(預測、決策、規劃)、控制執行

    以往行業的關注點都是在感知層面,因為感知這一塊就已經夠難搞了,認知層面其實是更加難搞。

    很多自動駕駛公司談到這塊都會隱晦不言。

    那不如看看毫末是怎么說的吧

    當前自動駕駛認知主要是靠傳統規則定義的算法來做決策規劃。但是這一方法進入瓶頸期,難以取得圖譜。特別是在馬上到來的復雜城市場景。

    所以,毫末就開始嘗試使用人駕自監督大模型的方式來提升決策效果。

    那么,毫末是怎么做的呢?——大致也分了三階段:

    第一個階段,引入個別場景的端到端的模仿學習,直接擬合人駕行為;

    第二個階段,通過認知大模型,引入海量正常人駕數據,通過Prompt的方式實現認知決策的可控、可解釋;

    第三個階段,也就是毫末認知決策算法現在處于的階段,引入真實接管數據,并在大模型中開始使用RLHF(人類反饋強化學習)算法,讓模型學習人駕接管數據。

    為啥要開始采用RLHF算法呢?

    毫末CEO顧維灝說,用大模型去擬合海量人駕數據,會導致訓練出的模型傾向于擬合平均值,而非最優值,也就是練出一個普通司機的水平。

    所以,第三階段,引入這個和ChatGPT采用同樣強化學習的RLHF技術,就是要去學習那些人類更好的駕駛策略,來優化自己的算法。

    也就是說,當毫末認知決策算法通過擬合、學習人駕數據,具有一定的駕駛決策能力后,毫末構建了一個自動駕駛決策的獎勵模型(reward model),從而在各種規劃場景情況下做出最優的決策。

    所以,毫末CEO顧維灝才會在今年1月AI DAY上,提到自家的認知大模型和ChatGPT思路不謀而合。現在想來,當時的判斷確實是比較有前瞻性的!

    事實上,毫末最早在行業就布局研究Transformer大模型,現在又提前將ChatGPT技術納入自己的技術體系

    所以,為啥是毫末搞出了DriveGPT!

    其實就是天下武功,唯快不破!

    那DriveGPT到底有多能打呢?恐怕還得期待今年4月份毫末的發布。

    如果說,從毫末DriveGPT里學到點什么經驗呢?

    我們可以從這個圖里找到答案!

    每一次的技術飛躍,不就是一群技術狂人的孤注一擲嗎?

    如果說一次技術革命必然有一個確定的結果的話,那恐怕這個世界會非常的無聊。

    但正是一些難以企及的目標和一些敢為人先的勇氣,就會鞭策我們全力奔跑。

    取乎其上,得乎其中……古人把生存的智慧早就寫好了。

    標簽: 強化學習 這個事情 技術革命

    上一篇:
    上一篇: