Alphabet旗下的自動駕駛汽車公司Waymo宣布,已開始使用Google的多模態大型語言模型(LLM)Gemini來提升自動駕駛技術,將為其無人駕駛計程車隊帶來重大突破。Waymo利用名為Gemini的AI模型,進行自動假使技術的「端到端」訓練,藉此提升機器人計程車的決策能力,使其能更精準地應對日益複雜的道路情況。
編譯/安德烈
Alphabet旗下的自動駕駛汽車公司Waymo宣布,已開始使用Google的多模態大型語言模型(LLM)Gemini來提升自動駕駛技術,將為其無人駕駛計程車隊帶來重大突破。Waymo利用名為Gemini的AI模型,進行自動假使技術的「端到端」訓練,藉此提升機器人計程車的決策能力,使其能更精準地應對日益複雜的道路情況。
據報導,Waymo在最新的研究報告中提出了一個被稱為「端到端多模態模型」(End-to-End Multimodal Model for Autonomous Driving,簡稱EMMA)的系統。該模型使用了來自Gemini的多模態AI技術,可將感測器數據轉化為即時的行駛路徑,讓無人駕駛車輛在遇到障礙物或需要轉向時,能做出更快速且精確的反應。
Waymo解釋,傳統的自動假使系統通常會將感知、地圖、預測和規劃等功能分成不同模組,各司其職。然而,這樣的模組化設計易導致各模組間的訊息傳遞不暢,累積誤差。相較之下,Gemini能夠憑藉其強大的「世界知識」和「連鎖推理」能力,整合多重模態數據,並模擬人類的思考方式,進行更靈活的決策。
Waymo表示,Gemini作為「泛用型」AI,不僅能依賴行車日誌資料進行學習,還可從龐大的網路資料中學習,使其比傳統自動駕駛系統,更能應對未知環境。例如在路面遇到動物穿越或施工障礙時,EMMA模型可即時提供最佳行車路徑。
隨著自動駕駛技術的進步,其他公司如特斯拉也積極投入類似的端到端自動駕駛技術開發。特斯拉CEO馬斯克就曾公開表示,他們的最新自動輔助駕駛(FSD)系統,就採用了端到端神經網路。然而,Waymo擁有更成熟的自動駕駛技術,並已經在多個城市部署無人駕駛車輛,其EMMA模型的問世,無疑使其保持技術領先地位。
然而,Waymo也坦言,EMMA模型目前還面臨一些技術挑戰,如,基於計算需求過高,該模型尚未整合雷達或LiDAR的3D資訊處理。此外,模型也只能處理有限數量的影像幀數,Waymo強調,在將這項技術廣泛應用於實際道路環境前,還需進一步測試以確保安全性。
Waymo的研究團隊在部落格中表示,希望此項研究成果能激發更多學術及業界對自動駕駛系統的進一步探索,並提升自動駕駛架構的穩定性,未來他們將持續改進,期望Gemini能在未來發揮更大作用。
參考資料:TheVerge
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
這篇文章 Waymo 結合Google Gemini 提升自動駕駛技術 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
系統合作: 精誠資訊股份有限公司 資訊提供: 精誠資訊股份有限公司 資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所 |