ITBear旗下自媒體矩陣:

微軟AI負責(zé)人蘇萊曼:信息處理、長期記憶、三方交互是AI的三個階段

   時間:2024-10-18 17:17:29 來源:ITBEAR編輯:茹茹 發(fā)表評論無障礙通道
留胡子的男人

描述已自動生成

圖注:微軟AI CEO穆斯塔法·蘇萊曼

2024年諾貝爾獎的各個獎項已經(jīng)全部揭曉,令人矚目的是,諾貝爾物理學(xué)獎與化學(xué)獎雙雙花落AI領(lǐng)域。AI技術(shù)及其應(yīng)用成為今年諾獎最大的亮點。諾獎對AI相關(guān)成果及科學(xué)家的高度認可,不但有力地推動了AI技術(shù)的進一步發(fā)展和跨學(xué)科研究的深化,也預(yù)示著AI將以更快的速度推動人類社會的經(jīng)濟增長和高質(zhì)量發(fā)展。

AI的發(fā)展速度驚人,這在人類歷史上尚屬首次——機器學(xué)會了運用我們的語言。但AI所提供的信息能否符合人類的認知需求和價值判斷?AI能否真正理解語言背后的情感內(nèi)涵?在AI與人類深度交互的背景下,如何確保數(shù)據(jù)和隱私安全?從長遠來看,哪些挑戰(zhàn)可能成為制約AI持續(xù)發(fā)展的根本性因素?

在直面這些難題的同時,蘇萊曼先生對如何最大限度利用技術(shù)滿足用戶需求給出了一個清晰的路線圖。他探討了人工智能的發(fā)展、倫理問題以及未來的技術(shù)前景。這正是本次蘇萊曼先生采訪帶來的啟示。

張祺博士

微軟全球資深副總裁

微軟AI亞太區(qū)總裁

穆斯塔法·蘇萊曼與WIRED的資深記者Will Knight近期的深度訪談:

觀點導(dǎo)讀

Copilot 愿景:

我們的目標是創(chuàng)造一種伙伴間的持續(xù)互動體驗。這不僅僅關(guān)乎技術(shù),更在于提供情感支持。這正是科技時代的迷人之處——和真正理解你的AI伙伴互動。它會引導(dǎo)、鼓勵、支持并教導(dǎo)你,讓你不再覺得是在與一臺機器交流。

AI 智能體的三個階段:

信息處理階段:AI處理你所處理的相同信息——看到你所看到的,聽到你所聽到的,閱讀你所閱讀的文本。

長期記憶階段:AI擁有長期、持久的記憶,隨著時間的推移建立起共同的理解。

交互階段:AI通過發(fā)送指令和采取行動與第三方交互——購買物品、預(yù)訂服務(wù)、規(guī)劃日程。

與OpenAI的關(guān)系:

我們對OpenAI的模型進行了微調(diào),使其不僅專注于數(shù)學(xué)和科學(xué)問題解決,還能進行并列比較和消費者分析。當你遇到難題或想要推理某件事情時,它能夠進行并列比較或大規(guī)模分析。

AI的挑戰(zhàn):

挑戰(zhàn)在于如何打造可信賴的技術(shù),使其感覺像一個非常親密和個性化的體驗。建立信任體驗的基礎(chǔ)后,我們可以深入到更復(fù)雜的方面,例如代表你購買東西、進行談判、簽訂合同或規(guī)劃日程。

完整訪談

主持人: Copilot的愿景是什么?

穆斯塔法·蘇萊曼: 我們正處于一個驚人的轉(zhuǎn)型點。AI伙伴現(xiàn)在能夠看到我們所見,聽到我們所聽,并使用我們溝通的同一種語言。這種新的設(shè)計理念關(guān)注的是持久性、關(guān)系和情感。我們正在打造一種體驗,是關(guān)于與伙伴進行持久、持續(xù)互動。

主持人: 你從Inflection AI加入微軟,該公司專注于構(gòu)建支持性和同理心的AI。聽起來你在新的雇主這里也保持了這種理念。

穆斯塔法·蘇萊曼: 我一直相信AI具備提供支持的潛力。情感支持實際上是我19歲時參與的第一個項目,那時我啟動了一項電話咨詢服務(wù)。這正是這個技術(shù)時代的美妙之處——與一個真正了解你的AI伙伴互動。它會指導(dǎo)你、鼓勵你、支持你、教導(dǎo)你。我認為這將不再讓人感覺像是在跟一臺計算機互動。

主持人: Copilot Vision是什么?這個“l(fā)abs”功能將讓Pro用戶嘗試到什么?

穆斯塔法·蘇萊曼: Copilot Vision讓你能夠說“那邊的東西是什么(在你的屏幕上)?”或“等一下,那是什么?你覺得那個怎么樣?”在你坐在電腦前時,會有很多這樣的小瞬間。這個AI伙伴可以看到你所見,并實時與你討論你正在看的內(nèi)容,這是非常了不起的。它在某種程度上改變了你在數(shù)字生活中的體驗,因為你不必再費力鍵入內(nèi)容。

主持人: 這聽起來像是Recall,那項有爭議的、現(xiàn)在需要選擇的Windows功能,用于記錄用戶屏幕上的內(nèi)容。

穆斯塔法·蘇萊曼: 保護用戶的隱私是至關(guān)重要的。目前我們不會用Copilot Vision保存任何內(nèi)容,因此一旦會話結(jié)束后關(guān)閉瀏覽器,所有內(nèi)容都會消失,完全刪除。但我在思考是否以及如何在未來引入這一功能,因為很多人確實希望有這樣的體驗。如果你可以說,“我前幾天在網(wǎng)上看到的那張圖片是什么?那個表情包是什么?”我想我們總有一天得研究這個問題。不過目前,Copilot Vision工具是這樣的。我們需要隨著時間進行實驗,看看如何在這方面做更有意義的事情。

主持人: 你們還推出了Think Deeper,這將使Copilot能夠處理更復(fù)雜的問題。這是基于OpenAI的o1模型,也就是Strawberry,對嗎?

穆斯塔法·蘇萊曼: 是的,類似于Strawberry。我們對OpenAI的模型進行了調(diào)整,為了更符合消費者的需求,我們讓它以一種更符合AI伙伴主題的方式運行。

主持人: 有什么區(qū)別?

穆斯塔法·蘇萊曼: OpenAI的模型更專注于純數(shù)學(xué)和科學(xué)問題的解決。我們試圖讓它專注于并列比較和消費者分析等內(nèi)容。當你在解決一個難題時卡住了,想要推理時,它可以真正列出一個并列比較,或者進行大規(guī)模分析。

主持人: 微軟的人們已經(jīng)在使用這個新版本的Copilot了嗎?

穆斯塔法·蘇萊曼: 是的,大家都在使用。我們幾天前剛在公司內(nèi)部全面上線。所以每個人都在使用,并且提供大量反饋。我們的反饋渠道非常繁忙,這很有趣。

主持人: 人們會記得Clippy,微軟最后一個Windows AI助手。那里的員工有看到相似之處嗎?

穆斯塔法·蘇萊曼: 我前幾天見到了比爾·蓋茨,他說,你知道嗎,你給整個AI的命名搞錯了?應(yīng)該叫Clippy。這確實顯示了蓋茨這樣的人的前瞻性。他們不僅能預(yù)見未來兩年,還能預(yù)見未來二十年。

主持人: 新功能是否是朝著所謂的AI伙伴邁進了一步,AI伙伴可以在電腦上幫你處理有用的瑣事嗎?

穆斯塔法·蘇萊曼: 是的,絕對是。

第一階段是AI處理與用戶相同的信息——看到用戶所見、聽到用戶所聽、閱讀用戶閱讀的文本。第二階段是AI具備長期、持續(xù)的記憶,隨著時間的推移建立起共同理解。第三階段是AI通過發(fā)送指令和采取行動與第三方互動——比如購買東西、預(yù)訂東西、規(guī)劃日程。我們正在研發(fā)實驗?zāi)J街械倪@兩個功能。

主持人: 你們有一個可以為你去購買東西的Windows人工智能代理嗎?

穆斯塔法·蘇萊曼: 還有一段路要走,但沒錯,我們已經(jīng)完成了閉環(huán),實現(xiàn)了交易。這項技術(shù)的問題是,你可以讓它在50%、60%的情況下運行,但要達到90%的可靠性還需要付出很多努力。我已經(jīng)看到了一些令人驚艷的演示,它可以獨立完成購買等操作。但我也見過一些出狀況的時候,技術(shù)不知所措,無法正確應(yīng)對。

主持人: 能多告訴我一點所謂“出狀況”的事嗎?它是否用蓋茨的信用卡去買了輛蘭博基尼?

穆斯塔法·蘇萊曼: 如果它用的是蓋茨的信用卡,那就好笑了。但不,如我所說我們還在一步步摸索。這項技術(shù)仍然處于實驗室階段。還有很長的路要走,但我想進展可以按季度來計算,而不是按年。

主持人: 在實現(xiàn)你所描述的人工智能未來的過程中,你面臨的最大挑戰(zhàn)是什么?

穆斯塔法·蘇萊曼: 這里的關(guān)鍵在于如何打造一種值得信任的技術(shù),因為這將是一種非常親密和個人化的體驗。我們必須做好安全和隱私的部分。我認為真正的挑戰(zhàn)在于如何設(shè)計對話,使AI伙伴能夠明確地表達邊界,能夠說出“這是我不準備參與的事情”。

如果我們能做到這一點,那就是建立信任體驗的基礎(chǔ),然后我們就可以進一步推動更復(fù)雜的方面,例如讓它代表你購買東西、代表你談判、代表你簽訂合同,或者為你規(guī)劃一個周六下午涉及三四個不同站點的行程。你會說:“我相信你,Copilot,你能搞定,對嗎?”這正是我們努力的方向。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version