近期,關(guān)于OpenAI“草莓”項目的討論熱度持續(xù)攀升,引發(fā)了廣泛關(guān)注和熱議。其中,Perplexity AI的首席執(zhí)行官的一條暗示性推文,更是讓這一話題推向了新的高潮。網(wǎng)友們紛紛進(jìn)行在線測試,無形之中為自家的AI進(jìn)行了一輪宣傳。
這一周以來,OpenAI的“草莓”項目被炒得沸沸揚(yáng)揚(yáng),讓眾多關(guān)注者情緒高漲。在社交媒體X上,一位名為@iruletheworldmo的爆料者頻繁發(fā)帖,內(nèi)容幾乎都與“草莓”項目相關(guān),甚至暗示本周二將是OpenAI實現(xiàn)第二級AGI的重要日子。
據(jù)ITBEAR了解,這位爆料者自稱已獲得內(nèi)部消息,并表示全新的GPT-4o large模型將于8月13日正式發(fā)布。然而,在OpenAI的“草莓”項目真正露面之前,其競爭對手Perplexity AI已經(jīng)展示了具備類似“草莓”能力的新模型。
或者說,Q*已經(jīng)在Perplexity Pro上實現(xiàn)了這一功能。Perplexity AI的CEO Aravind Srinivas發(fā)布了一張自家AI破解“草莓測試”的圖片,引發(fā)了在線猜測——
“猜猜這是什么模型?”
與許多模型連一個單詞“strawberry”中的“r”數(shù)量都搞不清楚的情況相比,Perplexity AI的表現(xiàn)無疑令人印象深刻。
在另一個演示中,AI被問及如果將火星表面全覆蓋需要多少草莓。AI首先預(yù)估了火星的面積,然后計算了一個草莓的平均大小和所占面積,最后得出了覆蓋火星表面所需草莓的數(shù)量為1.87×10^17。
Perplexity AI是否真的上線了與OpenAI“草莓”能力相當(dāng)?shù)哪P??這一問題引發(fā)了廣泛討論。網(wǎng)友們實測后發(fā)現(xiàn),Perplexity Pro的強(qiáng)大之處在于它能夠通過逐步、漸進(jìn)式的思考給出結(jié)果。
例如,當(dāng)查詢大腦中量子糾纏現(xiàn)象時,AI會搜索關(guān)于量子糾纏的信息及其潛在含義,或與大腦相關(guān)的理論,然后進(jìn)一步查詢最近關(guān)于量子糾纏對大腦/意識產(chǎn)生影響的研究或理論。
有網(wǎng)友實測表示,Perplexity AI可以輕松搞定任意單詞或句子中的“r”。然而,也有網(wǎng)友發(fā)現(xiàn),Perplexity在這里其實有“作弊”的嫌疑——它并沒有去“數(shù)”,而是調(diào)用代碼解釋器寫了一段代碼,然后給“算”了出來。
評論區(qū)里,網(wǎng)友們意見不一。有的人認(rèn)為,這是原理幻覺的一個很好的步驟。而也有人認(rèn)為,這是炒作,他們可能在字符串中數(shù)出n個字母,添加了25個微調(diào)的對話。