近期,據(jù)國外媒體報(bào)道,DeepSeek AI因其高效的訓(xùn)練效率而備受矚目。與Open AI的ChatGPT及其他機(jī)器學(xué)習(xí)平臺(tái)相比,DeepSeek AI在過去一周內(nèi)人氣急劇上升。
技術(shù)行業(yè)分析師Ben Thompson在其網(wǎng)站Stratechery上發(fā)布的報(bào)告中指出,DeepSeek AI的設(shè)計(jì)雖面臨諸多限制,但這些限制卻激發(fā)了機(jī)器學(xué)習(xí)計(jì)算能力上的創(chuàng)新。DeepSeek由一家位于中國的初創(chuàng)公司開發(fā),而該公司因貿(mào)易禁運(yùn)無法獲取美國Nvidia公司生產(chǎn)的高質(zhì)量半導(dǎo)體芯片。面對(duì)這一困境,DeepSeek的開發(fā)團(tuán)隊(duì)采用了多種人工智能優(yōu)化技術(shù),使得他們的機(jī)器學(xué)習(xí)平臺(tái)在性價(jià)比上實(shí)現(xiàn)了顯著提升。
據(jù)斯坦福大學(xué)2024年人工智能指數(shù)報(bào)告顯示,DeepSeek的開發(fā)團(tuán)隊(duì)聲稱,其最新版本的AI訓(xùn)練成本僅為560萬美元,相比之下,ChatGPT 4的訓(xùn)練成本高達(dá)7800萬美元,而谷歌的Gemini Ultra更是達(dá)到了1.91億美元。這一數(shù)據(jù)無疑彰顯了DeepSeek在降低訓(xùn)練成本方面的顯著成就。
華盛頓大學(xué)圣路易斯分校的科學(xué)家和消費(fèi)者也將從這一成本降低中受益。計(jì)算機(jī)科學(xué)與工程助理教授烏馬爾·伊克巴爾表示,他的實(shí)驗(yàn)室在使用這些平臺(tái)時(shí)需要花費(fèi)數(shù)萬美元,而中國初創(chuàng)公司的競(jìng)爭有望降低這一價(jià)格。
Stratechery的文章中提到,DeepSeek降低訓(xùn)練成本的一個(gè)關(guān)鍵方法是蒸餾。他們利用像ChatGPT這樣的成熟生成式AI系統(tǒng)來“教導(dǎo)”自己的系統(tǒng)如何完成工作。McKelvey Engineering的博士生也嘗試了這種方法來改進(jìn)大型語言模型,且無需額外的訓(xùn)練。
“要讓技術(shù)得到大規(guī)模采用,它們必須價(jià)格低廉?!币量税蜖枏?qiáng)調(diào),“這表明使用模型可以變得非常便宜?!彼€表示,這將使得他們能夠進(jìn)行更多大規(guī)模的實(shí)驗(yàn)。
然而,伊克巴爾也指出了DeepSeek等人工智能平臺(tái)存在的潛在問題。他主要研究的課題是互聯(lián)網(wǎng)安全和隱私,他警告說,運(yùn)行這些模型需要訪問大型硬件,而數(shù)據(jù)在傳輸?shù)皆贫说娜斯ぶ悄軝C(jī)器上時(shí),用戶可能會(huì)失去對(duì)數(shù)據(jù)的控制。這是一個(gè)非常嚴(yán)重的問題。
伊克巴爾進(jìn)一步指出,人工智能系統(tǒng)可以構(gòu)建龐大的監(jiān)控基礎(chǔ)設(shè)施,其中一些已經(jīng)以搜索引擎的形式存在,追蹤來自整個(gè)網(wǎng)絡(luò)的用戶數(shù)據(jù),以促進(jìn)電子商務(wù)。所有這些數(shù)據(jù)都會(huì)被發(fā)送給不同的人工智能供應(yīng)商,他們可以利用這些信息來分析用戶、推斷興趣、監(jiān)視甚至影響用戶。
另一個(gè)令人擔(dān)憂的趨勢(shì)是人工智能語言模型越來越多地融入移動(dòng)應(yīng)用。例如,人工智能在規(guī)劃假期方面的應(yīng)用越來越廣泛。當(dāng)人工智能使用各種應(yīng)用程序來完成這項(xiàng)任務(wù)時(shí),如果存在惡意軟件,它就有可能從用戶那里收集更多的數(shù)據(jù)并操縱人工智能尋求的結(jié)果。
“當(dāng)這些技術(shù)具有巨大潛力時(shí),它們會(huì)發(fā)展得非????!币量税蜖栒f,“你需要在設(shè)計(jì)中埋設(shè)護(hù)欄和保護(hù)措施。而當(dāng)前的人工智能系統(tǒng)卻沒有做到這一點(diǎn)?!?/p>