ITBear旗下自媒體矩陣:

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

   時(shí)間:2023-12-16 08:38:42 來源:互聯(lián)網(wǎng)編輯:瑞雪 發(fā)表評(píng)論無障礙通道

20位行業(yè)大咖激辯

編輯部 發(fā)自 凹非寺

量子位 | 公眾號(hào) QbitAI

不包含大廠在內(nèi),中美相加最后將有五、六家大模型公司笑到最后。

真正有野心的開發(fā)者該去做AI-First/AI-Native這類應(yīng)用。

最快兩年,自動(dòng)駕駛將迎來「ChatGPT」時(shí)刻。

端側(cè)推理會(huì)造真正的殺手級(jí)應(yīng)用。AI下一個(gè)階段更像是“掃雷”游戲。

大模型元年,在MEET2024智能未來大會(huì)上,20位行業(yè)大咖給出了這樣的年終總結(jié)。

ChatGPT給予了高度的評(píng)價(jià):看到AI技術(shù)在不同領(lǐng)域的應(yīng)用,真是讓人激動(dòng)不已。

數(shù)百位線下以及近三百萬線上的人類觀眾們也直呼干貨滿滿。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

不知道是不是因?yàn)榭萍紳舛冗^高,以至于有網(wǎng)友懷疑嘉賓到底是真人還是數(shù)字人……

嗯或許明年就是了。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

圍繞著「新起點(diǎn)·再出發(fā)」這一主題,本次大會(huì)主要分為了大模型時(shí)代下的「新思考」、以及給行業(yè)玩家?guī)淼摹感聭?yīng)用」、「新終端」以及「新模式」的變革變化。

來,跟著ChatGPT、Claude2等大模型一起來劃重點(diǎn)。

新思考新趨勢

李開復(fù):真正有野心的開發(fā)者該去做AI-First/AI-Native這類應(yīng)用

首先出場的,是創(chuàng)新工場董事長、零一萬物CEO李開復(fù)博士,他在今年被《時(shí)代》雜志評(píng)選為2023年度全球25位“AI領(lǐng)袖”。今年,創(chuàng)新工場塔尖孵化了AI 2.0公司零一萬物,其Yi系列大模型已經(jīng)交出了業(yè)界領(lǐng)先的成績。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

40多年前,李開復(fù)先后求學(xué)于哥倫比亞大學(xué)、卡內(nèi)基梅隆大學(xué),從而入行AI并成為這個(gè)領(lǐng)域國際著名專家和投資人。他坦言,40多年來,一直期盼親歷AGI的發(fā)生,曾經(jīng)一度躊躇于“我這一生看不到AGI了”。

但現(xiàn)在,通向AGI的道路正在逐漸清晰。

李開復(fù)認(rèn)為,AI 2.0是有史以來最偉大的技術(shù)革命和平臺(tái)革命,不僅改寫所有的用戶界面和APP,更會(huì)穿透各行各業(yè)創(chuàng)造巨大的價(jià)值?!癆I 2.0帶來的平臺(tái)型的機(jī)會(huì)比PC、移動(dòng)互聯(lián)網(wǎng)時(shí)代大十倍?!?/p>

當(dāng)前,中國大模型賽道已經(jīng)進(jìn)入到了“百模大戰(zhàn)”階段,競爭白熱化。從創(chuàng)業(yè)機(jī)會(huì)看,雖然大型預(yù)訓(xùn)練模型的創(chuàng)業(yè)窗口正在逐漸關(guān)閉,但在其他方面,如AI 2.0基礎(chǔ)設(shè)施和應(yīng)用方面,仍有很多機(jī)遇

AI 2.0時(shí)代的APP將被注入超級(jí)智能,帶來全新的界面和用戶體驗(yàn),成長速度將會(huì)洗刷新的記錄,會(huì)比移動(dòng)互聯(lián)網(wǎng)來得更兇猛,創(chuàng)造更多的價(jià)值,帶來更多的用戶。

真正有夢想、有野心的開發(fā)者應(yīng)該去做AI-First、AI-Native這類應(yīng)用,這些應(yīng)用將能充分利用AI技術(shù),從而成為最偉大和最具商業(yè)價(jià)值的公司。

其次,面對現(xiàn)在開閉源模型的激烈戰(zhàn)況,在李開復(fù)看來,二者的成長是一個(gè)延續(xù)的、你追我趕的事情,但是,“最終不會(huì)只有一家閉源的、偉大的GPT或大模型公司”。

他預(yù)判,不包含大廠在內(nèi),中美相加最后將有五、六家大模型公司笑到最后。

在收尾的快問快答環(huán)節(jié),李開復(fù)表示,并不是擅長所有人類做的事情才叫AGI,只要在某些領(lǐng)域能比人類聰明100倍,這就是一個(gè)有價(jià)值的AGI。雖然無法評(píng)判AI什么時(shí)候能夠具有真正的情感比如愛和同理心等,但它在一些領(lǐng)域已經(jīng)比人類聰明100倍。面對AI 帶來的風(fēng)險(xiǎn)和挑戰(zhàn),但他認(rèn)為,技術(shù)帶來的問題可以用技術(shù)來解決,同時(shí)輔以合理完善的法律法規(guī)來進(jìn)行AI治理,讓AI造福更多的人類。

他還表示,傳統(tǒng)的圖靈測試已經(jīng)不適用于當(dāng)前快速發(fā)展的AI 2.0時(shí)代,Agent進(jìn)入快速落地階段,我們需要更高級(jí)的技術(shù)來區(qū)分AI和真人。

李開復(fù)留下一個(gè)彩蛋:明年的量子位活動(dòng),將由他的數(shù)字化身來參會(huì)。

李培根院士:機(jī)器很難具有像人類那樣的不可名狀的意識(shí)流

“制造業(yè)需要站在AI巨人的肩上實(shí)現(xiàn)突破”,這一點(diǎn)在李培根院士的演講中得以充分闡述。

李培根院士認(rèn)為AI是一個(gè)既知道已知知識(shí)又可能生成新知識(shí)的“知識(shí)巨人”,而制造業(yè)要考慮的問題是如何充分利用AI進(jìn)行創(chuàng)新設(shè)計(jì),站在AI的肩上去洞察復(fù)雜的關(guān)聯(lián)。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

比如傳統(tǒng)的工業(yè)自動(dòng)化主要處理固定模式、確定性、有因果關(guān)系的問題。

然而,工程中實(shí)際上也存在大量不確定性、沒有固定模式、并非基于因果關(guān)系的但存在復(fù)雜關(guān)聯(lián)的問題:

知識(shí)可以看作是數(shù)據(jù)在時(shí)空中的關(guān)系。人類通常只能理解和認(rèn)知一些簡單的、線性的、低階關(guān)系,而高階關(guān)聯(lián)往往認(rèn)識(shí)不到,這就會(huì)掉入所謂“暗知識(shí)”的大海。

但現(xiàn)在,有大數(shù)據(jù)、AI技術(shù)加持,我們可以站在AI巨人的肩上洞察復(fù)雜的關(guān)聯(lián)。

需要特別注意的是,李培根院士表示雖然機(jī)器在很多方面可以超越人類思維,但很難具有像人類那樣不可名狀的意識(shí)流。

“意識(shí)流”這一概念由美國心理學(xué)家威廉·詹姆斯提出:

意識(shí)流像一條綿延不斷、不可分割的河流,人的意識(shí)由兩方面組成,一些是理性的、自覺的意識(shí),有一些是無邏輯的、非理性的無意識(shí)。

李培根院士表示,正是意識(shí)流使人類不至于被AI所役使,反而能夠利用AI增強(qiáng)自己的創(chuàng)造能力。

歐陽萬里:AI For Science能讓科學(xué)家“多快好省”地端出“美味佳肴”

上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家歐陽萬里分享了他們實(shí)驗(yàn)室在AI For Science的科研探索。

他將AI For Science形容為美食烹飪,需要AI學(xué)者同自然科學(xué)家一起合作。

如果把科學(xué)研究比作美食烹飪,實(shí)驗(yàn)數(shù)據(jù)相當(dāng)于優(yōu)質(zhì)食材,而AI for Science則讓科學(xué)家們能夠“多、快、好、省”地端出美味佳肴。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

于他個(gè)人而言,為何從計(jì)算機(jī)視覺轉(zhuǎn)型做AI For Science,有兩方面原因:第一、問題本身很重要;第二、問題本身很有趣。

關(guān)于問題重要性上,在歐陽萬里看來,自然科學(xué)領(lǐng)域面臨著AI領(lǐng)域同樣的問題,甚至還更為嚴(yán)峻。

一方面是少標(biāo)注、少樣本的問題。例如獲得一個(gè)蛋白質(zhì)結(jié)構(gòu)所需的投入時(shí)間和資源巨大,可能一位學(xué)者投入一年時(shí)間才能獲取一個(gè)蛋白質(zhì)的結(jié)構(gòu),即一個(gè)樣本標(biāo)注。

另一方面還會(huì)面臨數(shù)據(jù)表現(xiàn)形式多樣。自然科學(xué)從物理到生物到地球科學(xué),有不同的表現(xiàn)形式,從非常底層的原子表示,分子表示,有基因蛋白表示方式,如果來到地球科學(xué)又有大氣的表示。

表現(xiàn)形式本身多樣的形式下,怎么把數(shù)據(jù)處理好就是一個(gè)問題。

既然如此那應(yīng)該如何解決呢?隨后歐陽萬里結(jié)合自己研究團(tuán)隊(duì)成果做了進(jìn)一步解釋:

在氣象方面,他們推出的全球中期天氣預(yù)報(bào)大模型風(fēng)烏,首次實(shí)現(xiàn)了在高分辨率上對核心大氣變量進(jìn)行超過10天的有效預(yù)報(bào)。風(fēng)烏提出將大氣變量視作多模態(tài)輸入,從而使其得以運(yùn)用多模態(tài)和多任務(wù)深度學(xué)習(xí)方法。風(fēng)烏突破了傳統(tǒng)預(yù)報(bào)方法瓶頸并獲得對氣象數(shù)據(jù)關(guān)系的強(qiáng)大擬合能力,僅需30秒即可生成未來10天全球高精度預(yù)報(bào)結(jié)果,在效率上大幅優(yōu)于傳統(tǒng)模型。

新應(yīng)用新場景

昆侖萬維方漢:端側(cè)推理會(huì)造就真正的殺手級(jí)應(yīng)用

昆侖萬維董事長兼CEO方漢分享了《昆侖萬維AGI與AIGC探索之路,從大模型到AI Agent開發(fā)平臺(tái)》。

方漢分享了昆侖萬維關(guān)于AGI的探索歷程。目前昆侖萬維已經(jīng)構(gòu)建出自己的六大AI業(yè)務(wù)矩陣,包括AI大模型、AI搜索、AI音樂、AI游戲、AI動(dòng)漫、AI社交。他認(rèn)為,擁有自己的模型生成能力和專有模型對于企業(yè)在AI領(lǐng)域的發(fā)展至關(guān)重要。目前公司已經(jīng)在國內(nèi)推出了面向C端的AI搜索產(chǎn)品,此外還計(jì)劃面向海外市場推出游戲、音樂、動(dòng)漫和社交方向的AI產(chǎn)品。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

隨后他詳細(xì)談到了AI搜索、Agent以及端側(cè)推理這三大機(jī)遇。

比如AI搜索,他認(rèn)為能大幅縮短用戶搜索時(shí)間并提高信息獲取質(zhì)量。

他還談到了Agent的重要性,AGI的真正表現(xiàn)形式是Agent,但目前像不少大模型API還是需要一定的門檻。方漢認(rèn)為,這時(shí)候需要Agent,這種低代碼的、大模型的二次開發(fā)接口,讓所有用戶都能夠通過Agent讓大模型替自己做實(shí)際的工作以及更好地落地。

他還提到了降低AI訓(xùn)練和推斷成本的途徑,包括技術(shù)迭代、內(nèi)容革命和端側(cè)推理。

談及端側(cè)推理 ,方漢認(rèn)為這是個(gè)面向所有企業(yè)的機(jī)遇。只有“端側(cè)推理”才是最終的解決方案,才會(huì)造就真正殺手級(jí)應(yīng)用的產(chǎn)生。

他認(rèn)為,目前大模型付費(fèi)模式只是過渡階段,隨著技術(shù)迭代、內(nèi)容革命和端側(cè)推理的實(shí)現(xiàn),AI大模型最終會(huì)真正實(shí)現(xiàn)免費(fèi)模式,也只有實(shí)現(xiàn)了免費(fèi)模式,C端應(yīng)用才會(huì)迎來真正的大爆發(fā)。

這一波AI一定是大潮將起,落地為王。

商湯王曉剛:未來1-2年智能汽車處在關(guān)鍵時(shí)間點(diǎn)

商湯聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛則是分享了通用人工智能和大模型給智能汽車帶來的技術(shù)突破和發(fā)展的機(jī)遇。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

王曉剛認(rèn)為,ChatGPT改變了人工智能新范式,給AI規(guī)模化產(chǎn)業(yè)應(yīng)用打開新道路。這過程最明顯感知到的是算力需求激增,2018年商湯花50億建AI大裝置,很多人不理解。但今天所有談到的大模型,都建立在強(qiáng)大軟硬件基礎(chǔ)設(shè)施系統(tǒng)能力基礎(chǔ)之上。

那么現(xiàn)在大模型時(shí)代,又有什么樣的趨勢值得關(guān)注。王曉剛主要從智能座艙智能駕駛兩個(gè)方面談了談。

智能座艙方面,他談到了未來可基于大語言模型能力構(gòu)建座艙大腦,控制艙內(nèi)各種軟硬件,并借助艙內(nèi)外傳感器去全方位感知環(huán)境和乘客,包括駕駛員的需求。從應(yīng)用層面來說,目前已經(jīng)可以看到的趨勢,比如內(nèi)容生成、AI說明書、健康問診、旅游規(guī)劃等等,這些都將座艙內(nèi)的智能化體驗(yàn)提升到新層次。

智能駕駛方面,他主要談到了純視覺方向的發(fā)展趨勢。目前智能駕駛系統(tǒng)只有感知這部分用的是AI,其他很多都是基于手寫規(guī)則。但要想真正解決各種Corner Case更多還是需要依賴數(shù)據(jù)驅(qū)動(dòng),通過大模型去做感知、融合、定位、決策、規(guī)控,將所有模塊串聯(lián)起來,然后覆蓋盡可能多的場景。

比如像特斯拉端到端自動(dòng)駕駛解決方案,還有像今年商湯CVPR最佳論文實(shí)現(xiàn)多模塊連通的大模型,都是這種思路。

王曉剛做了對智能汽車未來的展望:未來一到兩年,我們智能汽車其實(shí)處在一個(gè)關(guān)鍵突破的時(shí)間點(diǎn)。

實(shí)際上有三件事,一是端到端數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)駕駛,二是以大模型為核心、為基礎(chǔ)的座艙大腦的出現(xiàn),三是駕艙融合,所有座艙和駕駛的體驗(yàn)在同一顆芯片,同一個(gè)用戶上實(shí)現(xiàn),大幅降低成本和算力,在產(chǎn)品級(jí)實(shí)現(xiàn)更好的融合,實(shí)現(xiàn)更好的智能駕駛和座艙的智能化的體驗(yàn)。

而所有這些都是以大模型為基礎(chǔ)的。

百度馬艷軍:AI原生應(yīng)用發(fā)展正迎來最好的時(shí)代

百度AI技術(shù)生態(tài)總經(jīng)理馬艷軍以文心一言為例,全面介紹了知識(shí)增強(qiáng)大語言模型,還介紹了圍繞大模型建設(shè)的生態(tài)以及未來發(fā)展趨勢。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

馬艷軍指出,要提升大模型的效果,數(shù)據(jù)和對齊技術(shù)尤為重要:

如何使用數(shù)據(jù),如何挖掘分析、合成、標(biāo)注、評(píng)估數(shù)據(jù),整個(gè)閉環(huán)非常關(guān)鍵。

此外,馬艷軍還從三個(gè)方面總結(jié)了大模型和此前AI領(lǐng)域其它技術(shù)突破的不同之處。

首先是交互方式,“這次真正有了一個(gè)顛覆式變化”,未來的應(yīng)用是通過自然語言的提示詞來調(diào)動(dòng)原生AI應(yīng)用實(shí)現(xiàn)的。交互效果行不行,直接影響了技術(shù)的普及。

第二是大幅降低了AI開發(fā)門檻,在這之前“要開發(fā)一個(gè)AI應(yīng)用要寫非常多的代碼”,基于大模型的應(yīng)用開發(fā)幾乎可以零代碼。

最后大模型不僅對產(chǎn)業(yè)應(yīng)用有影響,也推動(dòng)了科研的AI for Science新趨勢。

在這幾點(diǎn)突破的驅(qū)動(dòng)下,馬艷軍表示AI原生應(yīng)用發(fā)展正迎來最好的時(shí)代,以大模型插件接入為基礎(chǔ)進(jìn)一步衍生出更強(qiáng)大的Agent智能體,基于這些能力將會(huì)催生更多的AI原生應(yīng)用,數(shù)字技術(shù)和實(shí)體世界加速連接與融合。

馬艷軍也提到,訓(xùn)練大模型的挑戰(zhàn)很大,這其中包括模型體積大,訓(xùn)練難度高;算力規(guī)模大,性能要求高;數(shù)據(jù)規(guī)模大,質(zhì)量參差不齊等等。這些問題的存在,目前也對基礎(chǔ)軟硬件提出了更高的要求。

面壁智能李大海:大模型讓人和機(jī)器更加平等

面壁智能聯(lián)合創(chuàng)始人、CEO李大海分享主題為《智周萬物:讓AI智能體釋放大模型生產(chǎn)力》。

面壁智能是國內(nèi)最早做大模型的團(tuán)隊(duì),李大海認(rèn)為大模型要用在真實(shí)生產(chǎn)環(huán)境里,最關(guān)鍵的能力是邏輯推理。而面壁智能也著重在模型的邏輯推理能力方面進(jìn)行了攻關(guān)和提升。

據(jù)他介紹,面壁智能最新推出的千億多模態(tài)大模型CPM-Cricket可以對標(biāo)GPT-3.5的水平,同時(shí)邏輯推理能力十分突出。為了測試模型的邏輯推理表現(xiàn),面壁智能還給大模型做了公考行測考試,結(jié)果顯示其總正確率達(dá)到63.76%,甚至超過GPT-4的61.88%。在英文的GMAT測試中,面壁智能大模型的分?jǐn)?shù)是GPT-4的93%,已經(jīng)非常趨近。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

當(dāng)下大模型的技術(shù)路線在整個(gè)產(chǎn)業(yè)界已經(jīng)形成了共識(shí),但大模型變革到底是像web3這樣的技術(shù)浪潮還是十年為期的產(chǎn)業(yè)革命?

李大海認(rèn)為,大模型是第四次技術(shù)革命,可以和工業(yè)革命、信息革命相提并論,這場革命將至少持續(xù)20-30年

除了大模型之外,李大海還談到了智能體(AI Agent)的發(fā)展,他認(rèn)為智能體需要這樣幾個(gè)特性:人設(shè)、智商、情商、感知、價(jià)值觀和成長性等。對于成長性,李大海認(rèn)為目前還是基于數(shù)據(jù)閉環(huán)類似T+1或T+2的模式,未來希望能實(shí)現(xiàn)更為實(shí)時(shí)的成長性。

李大海打了個(gè)比方,大模型像是汽車引擎,但還需要轉(zhuǎn)向系統(tǒng)、汽車底盤、內(nèi)飾等各種配件組裝起來,才能真正提供一個(gè)完整的汽車產(chǎn)品。所以智能體需要在大模型基礎(chǔ)上疊加更多能力才能實(shí)現(xiàn)更多應(yīng)用和想象空間。

當(dāng)更多單體智能開始協(xié)作之后,它們將能發(fā)揮出更大的生產(chǎn)力。這時(shí)候就形成了更高級(jí)的智能——群體智能。自然界中就有很多類似案例,比如蟻群、蜂群、魚群等,它們帶來比個(gè)體更高的智能表現(xiàn)。

基于這種思考,過去幾個(gè)月,面壁智能共發(fā)布了三個(gè)智能體框架:AgentVerse,內(nèi)部包含非常多專家的智能體通用平臺(tái);ChatDev,多智能體智協(xié)作開發(fā)平臺(tái);XAgent,綜合能力全面超越AutoGPT的超強(qiáng)單體智能應(yīng)用框架。目前,面壁智能的“大模型+Agent”技術(shù)已在金融、法律等場景都有落地。

未來是否會(huì)存在基于大模型的超級(jí)應(yīng)用呢?李大海認(rèn)為大模型技術(shù)帶來的最根本變化,是人與機(jī)器之間關(guān)系的變化:機(jī)器變得更像人,人和機(jī)器會(huì)更加平等。

演講他還分享了面壁智能提出的“Internet of Agents”概念,他們認(rèn)為未來世界將會(huì)是一個(gè)由智能體所連接的萬物智聯(lián)的世界。

小冰李笛:AI下一階段更像“掃雷”游戲

小冰公司首席執(zhí)行官李笛的分享,從人們熱議的“人工智能著作權(quán)第一案”開始說起。

乙某在文章中使用了一張圖片,而圖片由甲某用開源AI繪畫軟件生成。法院判定乙某侵犯了甲某的知識(shí)產(chǎn)權(quán),支付了500元賠償費(fèi)用。

“500元的賠償費(fèi),可能是這張圖片目前為止在商業(yè)世界中,所能夠獲得最大的一筆回報(bào)了?!边@就引出一個(gè)話題點(diǎn)——AI在創(chuàng)造巨大的價(jià)值,但并不會(huì)收獲同等高的價(jià)值回報(bào)。

李笛表示,其實(shí)這就是今天AI領(lǐng)域商業(yè)模式的困局之一。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

過去一年,AI技術(shù)取得了巨大進(jìn)展,針對AI產(chǎn)品的偏見在迅速消融,李笛眼中,過去的一年是這個(gè)行業(yè)的黃金一年。

具體來看:

生成式AI模型效率提升巨大。幾年前,想要?jiǎng)?chuàng)造能夠一個(gè)能評(píng)價(jià)文章的AI-being時(shí),需要針對82類知識(shí)圖譜構(gòu)建它的三觀,要花費(fèi)約6個(gè)月時(shí)間。現(xiàn)在只需極短時(shí)間就可實(shí)現(xiàn)。

社會(huì)對AI的偏見正在消解,給予AI更大容錯(cuò)空間,有利于技術(shù)快速發(fā)展。

但是,李笛觀察到,目前AI應(yīng)用普遍面臨商業(yè)化難題:

一方面,現(xiàn)有API調(diào)用付費(fèi)模式難以體現(xiàn)AI系統(tǒng)的創(chuàng)造力價(jià)值。以文章寫作為例,AI完全取代撰稿員后獲得的市場規(guī)模非常有限。

另一方面,多數(shù)垂直領(lǐng)域AI系統(tǒng)替代人工作后獲得的收入,與替代的商業(yè)價(jià)值嚴(yán)重不匹配。

李笛認(rèn)為需要找到新的商業(yè)模式,讓AI系統(tǒng)能夠直接從內(nèi)容創(chuàng)造中獲得收益份額。

他還在分享中強(qiáng)調(diào),AI仍處于技術(shù)創(chuàng)新高速迭代的階段,未來在他眼中不像是槍響后賽道確定的賽跑,更像是不知AI能力上限的“掃雷”游戲。

這一階段,需要多樣化探索和寬容心態(tài),才能抓住近兩年巨大機(jī)遇,真正實(shí)現(xiàn)技術(shù)向應(yīng)用場景的轉(zhuǎn)化,改變?nèi)祟惿睢?/p>

螞蟻楊銘:從業(yè)務(wù)和應(yīng)用緯度擁抱多模態(tài)大模型

科技是創(chuàng)造未來的核心動(dòng)力——螞蟻集團(tuán)研究員、百靈多模態(tài)大模型研發(fā)負(fù)責(zé)人楊銘一上臺(tái),就拋出了這句話。他表示,這是螞蟻集團(tuán)一直所堅(jiān)信的。

在這句話的引領(lǐng)下,在過去一年,螞蟻集團(tuán)集中力量技術(shù)攻堅(jiān)交出了答卷:百靈語言大模型和多模態(tài)大模型。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

螞蟻為什么需要多模態(tài)大模型?

楊銘介紹,螞蟻具備豐富的多模態(tài)理解應(yīng)用場景,可以分為兩個(gè)緯度來看。從業(yè)務(wù)緯度來看,有數(shù)字支付和數(shù)字金融;從應(yīng)用緯度來看,有圖文理解、視頻分析、和圖像視頻內(nèi)容生成。

為此,螞蟻集團(tuán)從無到有,收集了數(shù)十億張中英文圖文對,通過無監(jiān)督學(xué)習(xí),訓(xùn)練出一個(gè)百億參數(shù)級(jí)別的圖文理解基礎(chǔ)大模型。

從零開始訓(xùn)練會(huì)面臨許多難題,比如缺乏開源初始化權(quán)重,train from scratch不收斂;比如訓(xùn)練成本高昂,迭代周期長;再比如訓(xùn)練集群調(diào)度和穩(wěn)定性問題。

最終,通過分階段訓(xùn)練策略,螞蟻解決了收斂問題;高昂的訓(xùn)練成本則通過優(yōu)化訓(xùn)練算法、IO與存儲(chǔ)、高效并行訓(xùn)練平臺(tái)解決。

楊銘在現(xiàn)場介紹,在這個(gè)圖文模型的基礎(chǔ)上,螞蟻衍生出了很多下游的垂類模型,包括將圖文理解模型應(yīng)用到圖文對話、視頻理解,以及文生圖、圖生圖等。

有了圖文對話的能力,從應(yīng)用角度,螞蟻開始逐漸落地到業(yè)務(wù)領(lǐng)域。譬如,廣告內(nèi)容審核就是業(yè)務(wù)領(lǐng)域的典型場景。在圖文理解的基礎(chǔ)上,螞蟻引入了時(shí)序的建模,分析幀與幀之間的關(guān)系,理解運(yùn)動(dòng),從而能將圖文模型擴(kuò)展成視頻任務(wù)模型,支持視頻到文本的檢索、文本到視頻的檢索以及視頻內(nèi)容生成跟理解。

此外,楊銘表示針對圖像生成模型難以直接投入產(chǎn)品應(yīng)用的問題,螞蟻開發(fā)了若干可控生成技術(shù),通過自參考圖提取目標(biāo)風(fēng)格實(shí)現(xiàn)可控風(fēng)格泛化,只需要輸入單張圖像即可實(shí)現(xiàn)風(fēng)格遷移、人臉特效等效果,大大加快了技術(shù)到產(chǎn)品的節(jié)奏。

360梁志輝:大模型時(shí)代讓所有人可被增強(qiáng)而非被取代

360集團(tuán)副總裁、360大模型應(yīng)用負(fù)責(zé)人梁志輝則分享了他們大模型應(yīng)用在企業(yè)生產(chǎn)的落地心得和案例。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

首先梁志輝認(rèn)為大模型時(shí)代,模型跟人的關(guān)系不是取代而是增強(qiáng)。所有人無論在日常辦公、企業(yè)營銷上,大模型能將人的閱讀、寫作、查找的速度大大提升起來。

但生成式AI或生成式大模型并非萬能,很多大模型現(xiàn)在還存在幻覺、缺乏行業(yè)知識(shí)、需要提示詞工程等挑戰(zhàn)。

提示詞工程這一點(diǎn)為例,提示詞模版非常復(fù)雜,只有AI發(fā)燒友才有可能精通,這樣不有利于大模型的推廣。其次,高質(zhì)量內(nèi)容很難靠大模型生成,要想推廣大模型就要揚(yáng)長避短。

基于這種思考,他們選擇以一種全新的人機(jī)協(xié)同方式落地——讓大模型變成每個(gè)人的助手。

大模型的長處在于內(nèi)容生成和內(nèi)容理解。過去很長一時(shí)間,看到很多聊天機(jī)器人的誕生。但這種機(jī)器人就像是小學(xué)生對大模型進(jìn)行催眠,告訴大模型現(xiàn)在是某個(gè)角色,并按套路提供答案;但它并不了解產(chǎn)品、公司以及協(xié)作方式。

梁志輝表示,我們希望讓大模型能夠像一個(gè)掌握多種技能、具備行業(yè)知識(shí),會(huì)使用多種工具的自主智能體Agent。這個(gè)Agent以整個(gè)互聯(lián)網(wǎng)做它的知識(shí)背景,能夠被訓(xùn)練,可以幫你查匯率、查天氣,甚至訂機(jī)票。

基于千億大模型和Agent架構(gòu),梁志輝分享了他們現(xiàn)在關(guān)注的三大場景的應(yīng)用:智能營銷、智能辦公以及智能客服

尤其像這個(gè)諸葛亮數(shù)字人做文旅,會(huì)上備受觀眾和網(wǎng)友們好評(píng)。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

新終端新交互

Rokid祝銘明:明年XR技術(shù)熱度可能超過AI

未來5年,希望把所有人的眼鏡換成智能眼鏡。

上述這句話,就是Rokid創(chuàng)始人&CEO Misa對不久的未來的堅(jiān)定展望。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

在演講中,Misa分享了他對AI與AR技術(shù)融合的看法,以及Rokid如何將這兩項(xiàng)技術(shù)結(jié)合在一起,打造新一代人機(jī)交互平臺(tái)。

2014年,Misa離開阿里巴巴,創(chuàng)立了Rokid。在他看來,AI和AR技術(shù)分別代表了對物理世界和數(shù)字世界的理解和交互能力,而他本人背負(fù)的使命,就是把AI和AR融合在一起,“融合成一件事情”。

大家更容易被硬件抓住眼球,但實(shí)際上,Rokid(不僅僅是一家眼鏡公司,而)是一家致力于AI和AR人機(jī)交互的公司。

現(xiàn)場,Misa將Rokid的打法進(jìn)行了拆解:通過在硬件、軟件、算法等方面的持續(xù)打磨,逐步將產(chǎn)品推向消費(fèi)者市場。

今年,Rokid發(fā)布了消費(fèi)級(jí)OST(Optical See Through光學(xué)透視)個(gè)人空間計(jì)算平臺(tái)Rokid AR Studio。

空間計(jì)算是什么?Misa給出的解釋,是其本質(zhì)是物理世界和數(shù)字世界的融合,以及在這種融合下如何用自然、易用的方式進(jìn)行信息的展示和交流。

他進(jìn)一步補(bǔ)充道,行業(yè)目前有兩條路線——

一條是以Apple為代表的VST(Video See Through),是把用戶包裹在一個(gè)純粹的數(shù)字世界里,通過傳感器把物理世界數(shù)字化、在虛擬世界里重建。

一條則是Rokid選擇的OST,更輕量化,在數(shù)字世界疊加真實(shí)世界,讓用戶用肉眼去感知。

Misa給出了自己的判斷:短期內(nèi),兩條路線沒有對錯(cuò),并將長期共存。

“誰是更好,誰不好,還是交給時(shí)間去解決?!盡isa最后表示,他相信明年XR技術(shù)將取得更大的突破,熱度甚至可能超過AI。

vivo周圍:大模型目前最能完成體驗(yàn)閉環(huán)和商業(yè)閉環(huán)的場景就是手機(jī)

2023年下半年開始,全球手機(jī)廠商紛紛加速,把大模型“塞”進(jìn)手機(jī)。

vivo為例,該公司的大模型戰(zhàn)略可總結(jié)為5點(diǎn):大而全、算法強(qiáng)、真安全、自進(jìn)化、廣開源。

具體做法圍繞兩步走,一是大模型開發(fā),一是大模型落地。

大模型開發(fā)方面,該公司正式發(fā)布自研AI大模型矩陣藍(lán)心大模型,以及全新手機(jī)操作系統(tǒng)OriginOS 4。

vivo副總裁、OS產(chǎn)品副總裁、vivo AI全球研究院院長周圍在MEET2024大會(huì)現(xiàn)場分享,藍(lán)心大模型包含十億/百億/千億三個(gè)參數(shù)量級(jí),共5款大模型。如今,70億參數(shù)版本對外開源,130億版本在端側(cè)跑通。

大模型如此神奇,是因?yàn)?span style="BOX-SIZING: border-box; FONT-WEIGHT: bolder; OUTLINE-WIDTH: 0px; OUTLINE-STYLE: none; OUTLINE-COLOR: invert; -webkit-tap-highlight-color: rgba(0, 0, 0, 0); text-size-adjust: none">它將人類數(shù)千年的文明知識(shí)進(jìn)行了高緯度的抽象,并壓縮成每個(gè)人都可以獲取的知識(shí)和信息。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

再來看大模型落地應(yīng)用方面,vivo的軟硬結(jié)合路線。

硬件方面,和芯片廠商深度合作,加速大模型上手機(jī);軟件方面,推出多種應(yīng)用形式、并和底層系統(tǒng)深度融合,讓消費(fèi)者能更快上手體驗(yàn)。

但腳步不應(yīng)該在這里停滯。

周圍透露道手機(jī)廠商更加關(guān)注大模型應(yīng)用給人帶來的實(shí)際體驗(yàn)如何,因此他認(rèn)為,大模型還要有像人類一樣的邏輯思維、情感和價(jià)值觀。

在這一點(diǎn)上,最能完成體驗(yàn)閉環(huán)和商業(yè)閉環(huán)的場景就是落地在手機(jī)上,打造智能體。

周圍說道:“未來,我們希望利用AI的能力,進(jìn)一步重構(gòu)系統(tǒng),并通過智能手機(jī)的普及,攜手邁向智能體時(shí)代?!?/p>

小米欒劍:大模型從技術(shù)參數(shù)上秀肌肉,沒什么意義了

在小米看來,大模型有三要素:大數(shù)據(jù)、大參數(shù)、大任務(wù)。這里面哪個(gè)才是大模型產(chǎn)生泛化能力的關(guān)鍵?

小米集團(tuán)技術(shù)委員會(huì)AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍給出了他的觀點(diǎn):

我們覺得參數(shù)量并不是一個(gè)最關(guān)鍵的因素,小一點(diǎn)的模型也能產(chǎn)生泛化能力。

這一觀點(diǎn),也體現(xiàn)在了小米對大模型研發(fā)的全過程中。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

2016年,小米就已開始在AI領(lǐng)域布局,近幾年對AI的投入更是持續(xù)增長。據(jù)透露今年技術(shù)研發(fā)總投入預(yù)超200億,預(yù)計(jì)最近5年(2022-2026)會(huì)投入1000億。

小米大模型的突破點(diǎn)不是“大”,而是輕量化和本地部署。

欒劍表示,這和小米的特色有關(guān),小米有各種各樣的硬件設(shè)備,是全球最大的消費(fèi)級(jí)IoT平臺(tái),截止今年第三季度,聯(lián)網(wǎng)設(shè)備總量近7億,擁有5臺(tái)以上小米IoT設(shè)備的用戶數(shù)達(dá)到1370萬。

小米的想法是把大模型當(dāng)作大腦,搭載到硬件設(shè)備中。

就像有一臺(tái)掃地機(jī)器人,它可以不會(huì)聊天,也可以不用寫小作文,但它需要會(huì)路徑規(guī)劃、躲避障礙物等。

欒劍談到,“小米特別關(guān)注的,并不是行業(yè)所說的通用大模型,也不是垂類大模型,而是場景大模型”。

從技術(shù)參數(shù)上來秀肌肉我覺得沒有什么意義了,接下來我們回歸到怎么把大模型用好。

接下來小米還要探索同場景多設(shè)備協(xié)同、跨場景設(shè)備。欒劍表示云邊端結(jié)合是將來發(fā)展很重要的一條路徑。

最后欒劍就“大模型應(yīng)用成敗關(guān)鍵是什么?”這一問題,給出了自己的看法:

所有應(yīng)用都有兩個(gè)關(guān)鍵點(diǎn),一個(gè)是流量入口在哪里?另一個(gè)是用戶粘性靠什么?

欒劍認(rèn)為大模型本身是一個(gè)入口,而跟操作系統(tǒng)深度融合,操作系統(tǒng)就是入口,歸根結(jié)底操作系統(tǒng)需要一個(gè)硬件。至于用戶粘性,要探索如何讓大模型無處不在地融入日常生活。

即“入口在硬件,粘性靠生態(tài)”。

新模式新機(jī)遇

高通顏辰?。褐挥挟?dāng)生成式AI在端側(cè)廣泛部署,才能實(shí)現(xiàn)真正大爆發(fā)

當(dāng)前,生成式AI模型復(fù)雜度持續(xù)上升,圍繞基礎(chǔ)模型的新應(yīng)用在不斷涌現(xiàn),并且用戶數(shù)量也在不斷增加。

基于此,高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁顏辰巍帶來的思考是:AI最終要落地在端側(cè),才能實(shí)現(xiàn)真正大爆發(fā)。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

為什么要在端側(cè)支持生成式AI,高通有三點(diǎn)考量。

一是云端AI模型推理成本高昂,當(dāng)數(shù)十億用戶都在使用越加復(fù)雜的模型時(shí),云計(jì)算推理綜合成本會(huì)急劇增加,云經(jīng)濟(jì)難以支持生成式AI規(guī)?;瘮U(kuò)展。

二是大量數(shù)據(jù)本身就發(fā)生在端側(cè),在終端側(cè)處理AI是最經(jīng)濟(jì)的,也能夠更好的保護(hù)用戶隱私。

三是有些應(yīng)用場景可能沒有5G數(shù)據(jù)連接,比如在野外,車座艙里的司機(jī)與車交互的應(yīng)用。這時(shí)候就必須有本地計(jì)算能力。

所以只有當(dāng)終端就能運(yùn)行基于AI大模型的用例時(shí),端側(cè)與云側(cè)能很好的結(jié)合,生成式AI才能大規(guī)模普及,發(fā)揮出所有的潛力。

此外,大語言模型的性能正在變得愈發(fā)強(qiáng)大,隨著基礎(chǔ)模型的創(chuàng)新,很多用例可以完全在終端上運(yùn)行。而這將實(shí)實(shí)在在的改變?nèi)藗兓?dòng)的方式。

為實(shí)現(xiàn)端側(cè)AI算力突破,顏辰巍介紹到高通近期發(fā)布了兩款專為生成式AI而打造的全新平臺(tái),面向PC的驍龍X Elite和面向智能手機(jī)的第三代驍龍8。顏辰巍指出,第三代驍龍8能夠支持在終端側(cè)運(yùn)行高達(dá)100億參數(shù)的生成式AI模型,并以20 token/秒的速度運(yùn)行大語言模型,而驍龍X Elite是高通公司迄今為止面向PC打造的最強(qiáng)計(jì)算處理器,支持在終端側(cè)運(yùn)行超過130億參數(shù)的生成式AI模型,憑借快達(dá)競品4.5倍的AI處理速度,將繼續(xù)擴(kuò)大高通在AI領(lǐng)域的領(lǐng)先優(yōu)勢。

浪潮信息吳韶華:從GPT-3到GPT-4訓(xùn)練模式的變化需要算法與數(shù)據(jù)的同步改進(jìn)

浪潮信息AI軟件研發(fā)總監(jiān)吳韶華,在MEET大會(huì)的舞臺(tái)和大家一起回顧了GPT-3到GPT-4/ChatGPT發(fā)生的重要變化。

GPT-3是一種預(yù)訓(xùn)練大模型,直接通過提示詞來使用;而GPT-4則在預(yù)訓(xùn)練之外,引入了微調(diào)和強(qiáng)化學(xué)習(xí)等技術(shù),極大提升了模型的能力。

“OpenAI和DeepMind等都在大模型的擴(kuò)展率上做了很多工作。”吳韶華補(bǔ)充了目前業(yè)界的一種共識(shí),他舉例說,“比如說在給定模型結(jié)構(gòu)的情況下(即Transformer結(jié)構(gòu)),隨著模型參數(shù)量增大、投入算力規(guī)模和數(shù)據(jù)規(guī)模越大,模型的精度往往會(huì)更高。以往這些擴(kuò)展率的研究是在預(yù)訓(xùn)練的范式下開展的。在預(yù)訓(xùn)練+微調(diào)的范式下,尤其在微調(diào)的重要性越來越高的情況下,如何改進(jìn)算法、數(shù)據(jù)以適應(yīng)預(yù)訓(xùn)練與微調(diào)不同階段的特性,值得我們重新思考。”

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

吳韶華分析認(rèn)為,從GPT-3到GPT-4訓(xùn)練模式的變化需要算法與數(shù)據(jù)的同步改進(jìn)。

他拿實(shí)踐經(jīng)驗(yàn)來證明浪潮信息在這方面的思考:

2021年9月,2457億參數(shù)的經(jīng)典Transformer結(jié)構(gòu)大模型源1.0發(fā)布,2023年9月,浪潮信息又新發(fā)布了源2.0。兩個(gè)版本的迭代的最主要改進(jìn),體現(xiàn)在三個(gè)方面——

第一是算法的改進(jìn)。浪潮信息提出了一種新型注意力機(jī)制LFA(Localized Filtering-based Attention),針對自然語言的局部依賴關(guān)系進(jìn)行了建模,通過考慮單詞之間的局部依賴關(guān)系,相比LLaMA結(jié)構(gòu)模型精度提高4.4%。

第二是數(shù)據(jù)的改進(jìn)。源2.0與源1.0相比,在訓(xùn)練數(shù)據(jù)來源、數(shù)據(jù)增強(qiáng)和合成方法方面進(jìn)行了創(chuàng)新。與一味提升數(shù)據(jù)的體量相比,源2.0更注重提升數(shù)據(jù)的質(zhì)量。由于中文數(shù)學(xué)、代碼數(shù)據(jù)資源有限,源2.0的訓(xùn)練數(shù)據(jù)來源除了互聯(lián)網(wǎng),還采用了基于大模型的數(shù)據(jù)生產(chǎn)及過濾方法,在保證數(shù)據(jù)的多樣性的同時(shí)也在每一個(gè)類別上提升數(shù)據(jù)質(zhì)量,獲取了一批高質(zhì)量的數(shù)學(xué)與代碼預(yù)訓(xùn)練數(shù)據(jù)。

第三是計(jì)算的改進(jìn)。針對多元異構(gòu)芯片間P2P帶寬的極大差異,浪潮信息提出了一種非均勻流水并行的分布式訓(xùn)練方法,大幅減少對芯片間互聯(lián)帶寬的需求。

吳韶華介紹,源2.0發(fā)布后,浪潮信息發(fā)布了“源2.0大模型共訓(xùn)計(jì)劃”。開發(fā)者可以將模型在應(yīng)用場景中的能力缺陷進(jìn)行反饋,浪潮信息研發(fā)團(tuán)隊(duì)將收集、清洗相關(guān)數(shù)據(jù)進(jìn)行模型增強(qiáng)訓(xùn)練,訓(xùn)練后的模型將持續(xù)開源。

潞晨卞正達(dá):分布式算法降低大模型部署門檻和訓(xùn)練成本

潞晨科技聯(lián)合創(chuàng)始人兼CTO卞正達(dá)帶來的主題是“Colossal-AI:AI大模型的挑戰(zhàn)與系統(tǒng)優(yōu)化”。

他首先介紹了大模型的時(shí)代背景,AI模型訓(xùn)練成本日益增長的趨勢。由此引入Colossal-AI框架,通過分布式算法來降低大模型的部署門檻和訓(xùn)練成本。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

卞正達(dá)具體介紹整個(gè)框架的設(shè)計(jì)思路,主要包括三大核心技術(shù)。

一是N維并行系統(tǒng)。卞正達(dá)團(tuán)隊(duì)發(fā)現(xiàn)此前市面上已有眾多并行技術(shù),但更多普通用戶拿到實(shí)際需求以后,很難選擇真正合適的并行方案,來轉(zhuǎn)化成實(shí)際落地的解決方案。

由此,Colossal-AI框架的核心思路是把目前最高效的并行技術(shù)整合到一套系統(tǒng)里,根據(jù)不同用戶的需求選擇合適的并行方案,同時(shí)提供最高效的落地實(shí)現(xiàn)。

第二點(diǎn)是高效的內(nèi)存管理系統(tǒng)。卞正達(dá)表示,在深度學(xué)習(xí)訓(xùn)練中,計(jì)算較重的板塊集中于存儲(chǔ)開銷比較少的部分,反而存儲(chǔ)開銷比較大的部分都集中在優(yōu)化器的參數(shù)更新上。

所以他們的思路是把冗余的存儲(chǔ)開銷放在比較便宜的存儲(chǔ)設(shè)備上,反映到Colossal-AI框架中,他們通過自適應(yīng)的管理系統(tǒng)實(shí)現(xiàn)更高效的管理參數(shù)的存放。

除此以外,Colossal-AI還實(shí)現(xiàn)了Chunk的管理系統(tǒng),為異構(gòu)的存儲(chǔ)也提供靈活管理。

通過上述系統(tǒng)優(yōu)化,Colossal-AI框架大幅降低了部署AI大型模型的門檻,模型訓(xùn)練和推理速度都得到了提升。

卞正達(dá)分享了Colossal-AI框架的實(shí)際應(yīng)用效果,只用了不到1000美元,就把LLaMA-2模型成功遷移到了中文模型上。

圓桌對話:最快兩年,自動(dòng)駕駛將迎來「ChatGPT」時(shí)刻

還有每年MEET大會(huì)的保留節(jié)目自動(dòng)駕駛圓桌對話。今年討論的話題是「自動(dòng)駕駛的ChatGPT時(shí)刻,還有多遠(yuǎn)?」

ChatGPT掀起的浪潮讓所有人都看到了生成式AI帶來的顛覆性影響,那一直備受關(guān)注的自動(dòng)駕駛,什么時(shí)候才會(huì)迎來自己的ChatGPT時(shí)刻?本次大會(huì)邀請到新一波自動(dòng)駕駛創(chuàng)業(yè)代表前來分享。他們是:

DeepWay深向聯(lián)合創(chuàng)始人兼CTO田山,也曾是百度Apollo商用車項(xiàng)目負(fù)責(zé)人。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

千掛科技聯(lián)合創(chuàng)始人廖若雪,他是曾在李彥宏和張一鳴身邊被稱為“技術(shù)天花板”的男人。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

還有“自動(dòng)駕駛領(lǐng)域天才少年”、零一汽車創(chuàng)始人兼CEO黃澤鏵,之前是圖森的聯(lián)合創(chuàng)始人。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

對于這個(gè)話題,田山從兩個(gè)角度來看,技術(shù)本身,通常完全自動(dòng)駕駛一定是需要的,但還需要一段時(shí)間的突破。但從需求看,目前很多限定場景里面自動(dòng)駕駛不需要使用大模型就能完成的很好,但要實(shí)現(xiàn)通用場景,大模型不可或缺。

廖若雪就談到實(shí)現(xiàn)「ChatGPT時(shí)刻」的關(guān)鍵標(biāo)志,則是自動(dòng)駕駛能不能被廣泛認(rèn)知到和看到。從他們商用車角度,就是越來越多客戶意識(shí)到自動(dòng)駕駛能帶來明顯的降本增效。

黃澤鏵的觀點(diǎn)則更為樂觀一些,他認(rèn)為現(xiàn)在ChatGPT展現(xiàn)出來的能力已超過了自動(dòng)駕駛本身所需的知識(shí)能力。

「ChatGPT時(shí)刻」的關(guān)鍵要素

那么具體如何實(shí)現(xiàn)呢?黃澤鏵談到了背后一個(gè)關(guān)鍵要素,就是將分模塊融合起來,在路徑上實(shí)現(xiàn)端到端。以往去做感知需要人為去定義,但如果以數(shù)據(jù)驅(qū)動(dòng)、基于大模型就可以解決更多長尾場景。

廖若雪則提到了閉環(huán)的重要性,他認(rèn)為自動(dòng)駕駛相關(guān)數(shù)據(jù)還是低數(shù)量級(jí),那么如何獲取并使用好數(shù)據(jù),大模型是很好的路徑,但數(shù)據(jù)從何而來,只有有足夠多的客戶能夠用起來,才能獲取大量的數(shù)據(jù)。這樣技術(shù)生產(chǎn)與商業(yè)落地形成一個(gè)相互促進(jìn)的閉環(huán)。

田山則談到了三個(gè)方面的挑戰(zhàn),第一是公認(rèn)的數(shù)據(jù)挑戰(zhàn),且各家都不一樣導(dǎo)致復(fù)用很困難;第二是算力的限制,端到端自動(dòng)駕駛需要足夠大的數(shù)據(jù)量和算力;第三,安全性問題。建議在端到端的學(xué)習(xí)過程中,能夠加入一些人工干預(yù)來確保安全性。

什么時(shí)候能到ChatGPT時(shí)刻?

今年還有個(gè)很大的因素在于政策。創(chuàng)始人們談到政策給整個(gè)行業(yè),包括客戶、投資人很強(qiáng)的信心,是一個(gè)很好的推動(dòng)方式。?澤鏵還補(bǔ)充道,但這并不是終極的政策。只有足夠多的數(shù)據(jù)做支撐,才能有進(jìn)一步探索。

既然如此,什么時(shí)候能到ChatGPT時(shí)刻呢?

廖若雪認(rèn)為是2025年。

?澤鏵認(rèn)為也是兩年時(shí)間。

而田山則保守估計(jì)在三到五年時(shí)間。

MEET智能未來大會(huì)萬字實(shí)錄,ChatGPT:看完讓人激動(dòng)不已

后續(xù)還將有大會(huì)嘉賓更詳細(xì)版內(nèi)容分享,敬請關(guān)注!

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version