【ITBEAR】近日,蘋(píng)果公司內(nèi)部研究團(tuán)隊(duì)揭露了一個(gè)令人驚訝的發(fā)現(xiàn):即便是目前最尖端的AI模型,在處理包含干擾信息的簡(jiǎn)單算術(shù)問(wèn)題時(shí),表現(xiàn)竟不如小學(xué)生。這一結(jié)果引發(fā)了關(guān)于人工智能真實(shí)能力的新一輪討論。
據(jù)《洛杉磯時(shí)報(bào)》報(bào)道,蘋(píng)果團(tuán)隊(duì)采用了一道涉及獼猴桃采摘數(shù)量的算術(shù)題進(jìn)行測(cè)試。題目描述了一個(gè)簡(jiǎn)單的場(chǎng)景:Oliver在三天內(nèi)采摘了不同數(shù)量的獼猴桃,其中還包括了一些額外的、與總數(shù)計(jì)算無(wú)關(guān)的信息。然而,就是這樣一個(gè)看似簡(jiǎn)單的問(wèn)題,卻讓20多個(gè)高級(jí)AI模型紛紛“栽跟頭”。
正確答案應(yīng)為190個(gè)獼猴桃,但多數(shù)AI模型給出的答案卻是185個(gè)。研究發(fā)現(xiàn),這些模型在處理問(wèn)題時(shí),難以忽略那些看似相關(guān)、實(shí)則無(wú)關(guān)的干擾信息,如“其中有5個(gè)獼猴桃的塊頭要比平均值要小”。這一細(xì)節(jié)雖不影響總數(shù)的計(jì)算,卻成功迷惑了眾多AI。
蘋(píng)果團(tuán)隊(duì)進(jìn)一步指出,這一問(wèn)題的根源在于,當(dāng)前的AI模型主要依賴于訓(xùn)練數(shù)據(jù)中的語(yǔ)言模式進(jìn)行推理,而非真正理解了數(shù)學(xué)概念本身。這意味著,在面對(duì)稍微復(fù)雜或包含非典型信息的問(wèn)題時(shí),AI的“智能”可能就會(huì)變得不再可靠。
值得注意的是,蘋(píng)果的研究并非旨在全盤(pán)否定AI的價(jià)值。相反,他們希望通過(guò)這一發(fā)現(xiàn),提醒人們?cè)跓崆閾肀I技術(shù)的同時(shí),也應(yīng)保持理性的認(rèn)知和審慎的態(tài)度。簡(jiǎn)單的數(shù)據(jù)擴(kuò)展或計(jì)算能力提升,并不能從根本上解決AI在邏輯推理方面的局限性。
此次研究不僅揭示了AI模型在處理復(fù)雜問(wèn)題時(shí)的潛在弱點(diǎn),也為未來(lái)AI技術(shù)的發(fā)展提供了新的思考方向。隨著技術(shù)的不斷進(jìn)步,我們期待看到更加智能、更加可靠的AI系統(tǒng)出現(xiàn)。