全班第一的論文是它寫出來的、89%的美國學(xué)生用它來完成作業(yè)、2個月內(nèi)超過1億用戶向它提問……最近一段時間,聊天機器人ChatGPT火遍全球,它以強大的語言處理能力、海量的數(shù)據(jù)積累等特點讓用戶感到驚訝甚至震撼。但隨著使用的人越來越多,ChatGPT開始暴露在一些場景下的缺陷和不足,讓網(wǎng)友吐槽“智障”。
用戶反映最多的問題是它經(jīng)?!耙槐菊?jīng)地胡說八道”。有時存在事實性錯誤,無法判斷它回答的對錯。不僅僅是在中文相關(guān)的題材下,就連在西方知識題材中也會胡言亂語。將王勃《滕王閣序》的詩句說成出自王煥之《登鸛雀樓》,將鋼琴女祭司瑪塔·阿格里奇說成20世紀最杰出的小提琴家之一。
有時結(jié)果并不穩(wěn)定,換個問法后甚至刷新一下ChatGPT回答可能會變化。
并且ChatGPT并不誠實,也無法查詢最新的信息,無法獲知最新的知識。這在一些垂直領(lǐng)域的使用中,特別是像高??蒲羞@種需要前沿研究和實時數(shù)據(jù)的場景下,實屬不便。問詢前沿問題,讓它幫忙查找一篇論文,它的回答看起來有條有理,但DOI指向的是另一篇論文,題目和作者甚至都是捏造不存在的。
對于互聯(lián)網(wǎng)上含有大量非英語語言,比如中文,沒有豐富的中文訓(xùn)練數(shù)據(jù),它有時就會胡言亂語。甚至當問題就是錯的時,ChatGPT仍然會順著往下說,一騙就上當。
再退一步,不在query設(shè)置專業(yè)限定詞,而是簡單問題,ChatGPT在中文語境的錯誤還是比較多的。
當ChatGPT脫離通用領(lǐng)域來到需要極其豐厚的領(lǐng)域知識的垂直領(lǐng)域,它還不一定合適。下圖是ChatGPT在中文字詞相關(guān)問題上的回復(fù),涉及拼音相關(guān)的知識,盡管好像有一些道理,但結(jié)果是錯誤的。
以上提到的一些缺陷,無疑說明了ChatGPT距離“完美”依然有著不小的距離,比如中文基準的自然語言處理效果、面對國內(nèi)用戶的限制、不能獲取新的知識等。
在當前全球的ChatGPT熱潮下,中國更應(yīng)該有自己的生成式AI產(chǎn)品,站在國際軍備競賽場上,與世界爭鋒。即使不完美,也是英雄。這不僅對于我國人工智能技術(shù)的發(fā)展和國際數(shù)據(jù)爭奪意義重大,也將會彌補了我國缺乏與國外人工智能對話機器人相匹配的人工智能技術(shù)帶來的一系列隱患。
上場即是勝利,哪怕不完美,能達到ChatGPT去年11月上市水平就行,早上線一個月都意義非凡。中國一定要有自己的生成式AI,無論是面向C端市場,還是面向B端市場,國內(nèi)市場都將因為這項技術(shù),迎來一輪新的發(fā)展契機。