近期,科技界傳來了一則令人驚訝的消息:OpenAI的o3-mini-high模型被曝出在推理過程中竟然頻繁使用中文。這一發(fā)現(xiàn)迅速引發(fā)了全球網(wǎng)友的廣泛關(guān)注和熱議。
眾多外國網(wǎng)友在各大社交平臺上紛紛曬出截圖,展示了o3-mini-high模型在思考問題時,中文語句頻繁出現(xiàn)的情景。這一現(xiàn)象讓不少網(wǎng)友感到困惑,他們不解為何在沒有明確指令的情況下,該模型會自發(fā)地采用中文進(jìn)行推理。
更為有趣的是,當(dāng)有網(wǎng)友使用俄語向該模型提問時,它依然選擇了中文作為思考語言。這一現(xiàn)象進(jìn)一步加劇了網(wǎng)友們的疑惑和猜測,不少人開始懷疑OpenAI是否抄襲了中國的DeepSeek模型。
針對這一質(zhì)疑,有分析人士給出了幾種可能的解釋。一種觀點認(rèn)為,中文相較于其他語言可能更為簡潔,因此在強化學(xué)習(xí)過程中更容易獲得獎勵,從而被模型更多地采用。另一種觀點則指出,OpenAI的通用模型,如GPT-3/4等,本身就具備多語言能力,中文推理只是其多語言能力的自然延伸。
GPT系列模型的訓(xùn)練數(shù)據(jù)涵蓋了互聯(lián)網(wǎng)上的多語言文本,包括中文,因此它們能夠處理中文輸入并生成相應(yīng)的回答。這些模型通過海量數(shù)據(jù)自動學(xué)習(xí)語言模式,無需為單一語言單獨設(shè)計架構(gòu),這也是它們能夠輕松應(yīng)對多種語言場景的原因。
然而,就在這一風(fēng)波尚未平息之際,彭博社又曝出了一則新的消息。據(jù)知情人士透露,微軟公司和OpenAI正在聯(lián)合調(diào)查一起數(shù)據(jù)泄露事件。他們懷疑與中國人工智能初創(chuàng)公司DeepSeek有關(guān)的團(tuán)體可能未經(jīng)授權(quán)地獲取了OpenAI的技術(shù)輸出數(shù)據(jù)。
據(jù)稱,微軟的安全研究人員在秋季發(fā)現(xiàn)了這一可疑行為,他們認(rèn)為可能與DeepSeek有關(guān)的個人利用OpenAI的應(yīng)用程序編程接口(API)竊取了大量數(shù)據(jù)。不過,OpenAI的首席執(zhí)行官奧特曼對此表示,他們目前并沒有計劃控告DeepSeek。