ITBear旗下自媒體矩陣:

馬斯克警示:AI訓(xùn)練數(shù)據(jù)已達(dá)極限,未來靠合成數(shù)據(jù)突破?

   時間:2025-01-13 22:53:45 來源:ITBEAR編輯:快訊團(tuán)隊 發(fā)表評論無障礙通道

近期,科技界巨頭馬斯克在CES展會上發(fā)表了一席引人深思的言論。他提到,當(dāng)前用于訓(xùn)練人工智能(AI)模型的現(xiàn)實世界數(shù)據(jù)資源已接近枯竭,這一臨界點據(jù)他判斷,是在去年,即2024年。

馬斯克強調(diào),人類長期積累的知識幾乎已被AI訓(xùn)練完全消耗。這一觀點并非孤例,早前在“NeurIPS”機(jī)器學(xué)習(xí)會議上,OpenAI的前科學(xué)主管Ilya Sutskever也曾表達(dá)過類似的看法,他認(rèn)為AI行業(yè)所能利用的數(shù)據(jù)量已達(dá)到極限。

面對數(shù)據(jù)資源的稀缺,馬斯克提出了一個創(chuàng)新性的解決方案:合成數(shù)據(jù)。他認(rèn)為,未來AI的發(fā)展將高度依賴于由AI自行生成的數(shù)據(jù)。這種數(shù)據(jù)不僅能夠補充現(xiàn)實世界的不足,還能讓AI通過自我評估和學(xué)習(xí),實現(xiàn)更高效的訓(xùn)練。

事實上,這一趨勢已經(jīng)初現(xiàn)端倪。多家科技巨頭,包括微軟、meta、OpenAI和Anthropic等,已經(jīng)開始在AI模型訓(xùn)練中廣泛應(yīng)用合成數(shù)據(jù)。據(jù)科技市場研究機(jī)構(gòu)Gartner預(yù)測,2024年,AI及分析項目所使用的數(shù)據(jù)中,合成數(shù)據(jù)占比已高達(dá)60%。

以微軟為例,其在今年1月8日開源的AI模型“Phi-4”,便是結(jié)合了合成數(shù)據(jù)和現(xiàn)實世界數(shù)據(jù)進(jìn)行訓(xùn)練的。同樣,谷歌的“Gemma”模型也采用了這一策略。Anthropic則利用部分合成數(shù)據(jù)開發(fā)了表現(xiàn)出色的“Claude 3.5 Sonnet”系統(tǒng)。而meta則通過AI生成的數(shù)據(jù),對其最新推出的Llama系列模型進(jìn)行了微調(diào)。

隨著AI技術(shù)的不斷發(fā)展,合成數(shù)據(jù)的應(yīng)用前景愈發(fā)廣闊。它不僅能夠解決現(xiàn)實世界數(shù)據(jù)稀缺的問題,還能為AI提供更豐富、更多樣的訓(xùn)練環(huán)境,從而推動AI技術(shù)的持續(xù)進(jìn)步。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version