ITBear旗下自媒體矩陣:

微軟亞洲研究院前首席譚旭,新動(dòng)向竟是加入月之暗面?

   時(shí)間:2024-10-23 09:21:05 來源:ITBEAR作者:蘇婉清編輯:瑞雪 發(fā)表評(píng)論無障礙通道

【ITBEAR】近日,有消息稱,前微軟亞洲研究院首席研究經(jīng)理譚旭已加入大模型創(chuàng)新企業(yè)月之暗面,擔(dān)任端到端語(yǔ)音模型研發(fā)的領(lǐng)軍人物。譚旭的加入,為月之暗面的技術(shù)研發(fā)注入了新的活力。

據(jù)悉,月之暗面自去年10月起便啟動(dòng)了多模態(tài)研究,目前有一個(gè)約10人的團(tuán)隊(duì)專注于視頻模型的研發(fā)。為確保產(chǎn)品的獨(dú)特性和競(jìng)爭(zhēng)力,公司對(duì)外發(fā)布計(jì)劃一直保持謹(jǐn)慎態(tài)度。

譚旭在生成式AI領(lǐng)域擁有深厚的研究背景,其論文引用量高達(dá)上萬(wàn)次。在微軟任職期間,他的研究成果已廣泛應(yīng)用于Azure、Bing等產(chǎn)品與服務(wù)中。

加入月之暗面后,譚旭的主要目標(biāo)是助力公司打造類似GPT-4o的語(yǔ)音體驗(yàn)。GPT-4o是OpenAI今年5月發(fā)布的多模態(tài)大模型,具備低延時(shí)、可隨時(shí)打斷等特性。

傳統(tǒng)的語(yǔ)音方案存在響應(yīng)時(shí)間長(zhǎng)、無法隨時(shí)打斷等問題。而端到端語(yǔ)音模型則省去了中間轉(zhuǎn)換過程,提高了響應(yīng)速度,并改善了“幻覺”現(xiàn)象。

譚旭的加入和端到端語(yǔ)音模型的研發(fā),無疑將為月之暗面在未來的市場(chǎng)競(jìng)爭(zhēng)中增添有力籌碼。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version