近日,國內領先的人工智能企業(yè)商湯科技與知名汽車制造商攜手,成功將行業(yè)首款原生流式多模態(tài)座艙產品推向市場,并通過OTA(在線升級)技術向用戶推送了最新功能。
這款產品的誕生,標志著AI技術在汽車座艙領域的應用邁出了重要一步。早在兩個月前,商湯科技就曾通過其AI汽車創(chuàng)新產品“你的家庭新成員”展示了其強大的AI能力。該產品能夠敏銳地捕捉車內環(huán)境變化,如檢測到后排孩子入睡時,會自動調整車內環(huán)境,如提升空調溫度、降低音樂音量,并將駕駛模式切換至舒適狀態(tài)。而這一切,都得益于其內置的原生流式多模態(tài)大模型。
現在,隨著多模態(tài)艙外識別功能的量產上車,這款AI產品開始展現出對外部世界的認知與理解。據悉,它已具備前車識別、交通標志識別以及沿途風光識別三大AI能力。例如,在行駛過程中,若前方有三輛顏色分別為紅、黃、藍的汽車,用戶詢問“藍色車輛是什么車”時,傳統模型可能會誤識別為中間的黃色車輛,而原生流式大模型則能準確識別出右前方的藍色車輛,甚至能夠識別出偽裝車、無車標等特殊外觀的車輛,通過尾燈、外形等特征進行品牌識別。
除了車輛識別外,這款AI產品還能在行駛過程中識別沿途的建筑物和景點,并提供詳細的圖文介紹,包括景點的歷史典故、趣聞逸事等,極大地豐富了用戶的駕駛體驗。
商湯科技聯合創(chuàng)始人、首席科學家王曉剛表示,原生流式多模態(tài)大模型能夠同時處理文字、語音、視頻等多種模態(tài)的信息,經過統一處理后輸出相應的信息。這種交互方式非常自然且新穎,將成為直接接觸用戶的全新超級入口,而智能汽車則是這一超級入口的最佳落地場景。通過智能汽車內外常開的攝像頭,用戶可以實時與汽車進行多模態(tài)交互,同時,隨著智能汽車保有量的不斷增加,豐富的終端用戶反饋和數據信息將為模型的迭代升級提供有力支持。