【ITBEAR】近日,蘋果公司內(nèi)部研究團隊對20個頂尖AI模型進(jìn)行了一項有趣的測試,結(jié)果令人大跌眼鏡。在面對包含干擾信息的簡單算術(shù)問題時,這些AI的表現(xiàn)竟不如小學(xué)生。
測試中,蘋果團隊使用了這樣一個問題:Oliver在連續(xù)三天的采摘活動中,分別摘取了不同數(shù)量的獼猴桃。星期五他摘了44個,星期六摘了58個,而星期日的采摘數(shù)量是星期五的兩倍。但在這其中,有5個獼猴桃的個頭明顯偏小。題目要求計算出Oliver這三天總共摘了多少個獼猴桃。
令人驚訝的是,盡管正確答案應(yīng)為190個,但大多數(shù)AI模型給出的答案卻是185個。顯然,它們在處理問題時受到了“5個獼猴桃個頭偏小”這一干擾信息的影響,錯誤地將這一信息與總數(shù)計算關(guān)聯(lián)了起來。
蘋果團隊的研究發(fā)現(xiàn),當(dāng)問題中包含有誤導(dǎo)性的信息時,AI模型的表現(xiàn)會顯著下降。這表明,這些模型在處理問題時更多地是依賴于訓(xùn)練數(shù)據(jù)中的語言模式,而非真正理解了數(shù)學(xué)概念或問題的本質(zhì)。
這一發(fā)現(xiàn)引發(fā)了人們對AI智能程度的重新思考。盡管AI在某些領(lǐng)域取得了顯著的進(jìn)展,但這次測試卻揭示出它們在處理復(fù)雜或含混信息時的局限性。這也提醒我們,在依賴AI技術(shù)時,需要更加謹(jǐn)慎地評估其性能和可靠性。
蘋果團隊的研究并非旨在貶低AI的價值,而是希望為AI的發(fā)展提供更為理性的視角。他們指出,單純地增加數(shù)據(jù)量或提升計算能力,并不能從根本上解決AI在處理這類問題時的困境。未來,我們需要在AI的訓(xùn)練方法和算法設(shè)計上尋求更多的突破和創(chuàng)新。