近日,科技界迎來了一項(xiàng)重大突破,OpenAI公司正式推出了其創(chuàng)新性的AI智能體——Operator。這款智能體被設(shè)計(jì)為能夠像人類一樣操作網(wǎng)頁瀏覽器,為用戶執(zhí)行各類基于網(wǎng)頁的任務(wù)。
在OpenAI的演示中,Operator展現(xiàn)了其卓越的能力。它能夠精準(zhǔn)理解各種指令,并自主完成一系列復(fù)雜任務(wù)。無論是打字、點(diǎn)擊、滾動等基本操作,還是填寫在線表單、在線購物、創(chuàng)建表情包以及處理重復(fù)性瀏覽器任務(wù),Operator都能游刃有余地完成。這種高度自主性和智能化水平,無疑為用戶帶來了前所未有的便捷體驗(yàn)。
值得注意的是,從1月23日開始,美國的ChatGPT Pro用戶已經(jīng)能夠率先體驗(yàn)到Operator的“預(yù)覽版”。據(jù)OpenAI透露,未來這一智能體將逐步拓展至更多區(qū)域的Pro用戶,并在幾個(gè)月后向ChatGPT Plus用戶開放。這意味著,越來越多的用戶將有機(jī)會親身感受到Operator帶來的革命性變化。
Operator的強(qiáng)大功能得益于其背后的先進(jìn)技術(shù)。據(jù)OpenAI官網(wǎng)介紹,這款智能體由全新的CUA(Computer-Using Agent)模型驅(qū)動,并結(jié)合了GPT-4的視覺能力。通過強(qiáng)化學(xué)習(xí),Operator實(shí)現(xiàn)了高級推理功能,能夠“看見”網(wǎng)頁內(nèi)容,并使用鼠標(biāo)和鍵盤與網(wǎng)頁進(jìn)行互動。當(dāng)遇到復(fù)雜或困難的任務(wù)時(shí),Operator會調(diào)用其推理能力進(jìn)行自我糾正,如果仍然無法解決問題,則會將控制權(quán)交還給用戶,確保用戶始終掌握主動權(quán)。