滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

阿里云百煉上線音視頻實(shí)時互動功能，人人都能創(chuàng)建專屬多模態(tài)應(yīng)用

時間：2024-12-19 16:16:16 來源：互聯(lián)網(wǎng)編輯：茹茹 發(fā)表評論無障礙通道

近日，阿里云百煉上線了全新音視頻實(shí)時互動功能，用戶可在百煉上自由選擇文本、語音和視覺理解等200多款模型，無需代碼，數(shù)分鐘即可搭建一個能聽、能看、會說的專屬AI助手。阿里云百煉還支持以sdk的形式集成到Web、ioS和安卓應(yīng)用，可應(yīng)用于AI虛擬助手、虛擬陪伴和AI老師等場景。

用戶在百煉上幾分鐘即可搭建一個能聽、能看、會說的專屬AI助手

過去一年，大模型正在從純文本模態(tài)向語音和視覺等多模態(tài)演進(jìn)，極大地拓寬了大模型應(yīng)用的想象空間。然而現(xiàn)有單一模型仍舊無法處理復(fù)雜的任務(wù)，為了進(jìn)一步加速單一大模型構(gòu)建成像人一樣自然交互的復(fù)雜AI應(yīng)用，阿里云百煉提供了200多款語言模型Qwen、視覺語言模型Qwen2-VL、語音合成模型CosyVoice等全模態(tài)全尺寸大模型，同時聯(lián)合阿里云AI實(shí)時互動方案，在國內(nèi)率先為用戶提供了便捷的工作流應(yīng)用和智能體編排應(yīng)用，例如支持構(gòu)建RAG知識庫、Prompt調(diào)優(yōu)、sdk集成等。

據(jù)介紹，在視覺理解模型方面，阿里云Qwen2-VL具備強(qiáng)大的視覺智能體能力，例如采用多模態(tài)旋轉(zhuǎn)位置嵌入(M-ROPE)方法，能夠同時捕捉和整合一維文本序列、二維視覺圖像以及三維視頻的位置信息，模型具備更好地理解和建模復(fù)雜的多模態(tài)數(shù)據(jù)，該模型一經(jīng)推出就成為開源社區(qū)最受歡迎的多模態(tài)大模型;在音頻方面，阿里云語音合成模型CosyVoice，通過對生成語音的情感、韻律進(jìn)行細(xì)粒度的控制，情感表現(xiàn)力上得到明顯提升，阿里云AI實(shí)時互動方案還可提供化智能降噪、智能打斷、智能斷句等超擬人對話能力。

以搭建一個視覺能力的AI應(yīng)用為例，用戶進(jìn)入百煉應(yīng)用控制臺后，僅需上傳圖片知識庫、編寫提示詞、設(shè)置音頻、調(diào)優(yōu)這四步，數(shù)分鐘內(nèi)就能創(chuàng)建一個能完成專屬視頻交互的AI應(yīng)用，基于Qwen-VL強(qiáng)大的視覺推理能力，它不僅能識別物體的種類，還能準(zhǔn)確描述物體的風(fēng)格、特點(diǎn)、位置以及物體上的文字等關(guān)鍵信息。此外搭建好的應(yīng)用還支持以音視頻sdk集成到用戶的Web、ioS或者安卓應(yīng)用中，幫助企業(yè)快速實(shí)現(xiàn)業(yè)務(wù)創(chuàng)新。

據(jù)介紹，阿里云百煉上的通義API每百萬tokens價(jià)格已降至0.3元，一汽、金山、哈啰集團(tuán)、國家天文臺等超30萬企業(yè)和機(jī)構(gòu)在使用阿里云百煉。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

寧德時代應(yīng)收賬款周轉(zhuǎn)天數(shù)連年攀升，如何應(yīng)對車企拖欠賬款壓力？

12-29

小米MK71 Pro機(jī)械鍵盤亮相：2025年1月1日眾籌，Gasket結(jié)構(gòu)+71鍵布局引期待

12-29

新款豐田蘭德酷路澤內(nèi)飾搶先看！全新儀表盤科技感爆棚

12-29

春節(jié)前A股布局良機(jī)？十大券商揭秘投資主線與策略

12-29

十月稻田高端大米之路遇阻，未來何去何從？

12-29

億航智能攜手中交信科，共筑低空經(jīng)濟(jì)與空中交通新生態(tài)

12-29

金星啤酒“牽手”信陽毛尖，能否借勢起飛實(shí)現(xiàn)上市夢？

而金星啤酒則表示，金星信陽毛尖中式精釀啤酒不僅為公司帶來新的增長點(diǎn)，也為啤酒企業(yè)的轉(zhuǎn)型發(fā)展探索出一條新路，同時還推動了信陽市毛尖茶產(chǎn)業(yè)的高質(zhì)量發(fā)展。在行業(yè)出現(xiàn)消費(fèi)萎縮的情況下，金星啤酒把信陽毛尖啤酒提升到…

12-29

AI工程師熱搶中，他們?nèi)绾卧趧?chuàng)業(yè)與大廠間做出選擇？

cc分享今年校招自己正在跟進(jìn)的一位候選人，在HR面試環(huán)節(jié)，候選人表示自己手上有好幾個大廠offer，也明確說了其它大廠給出的待遇，著急的cc打算繼續(xù)加碼薪資，吸引人才。晨然選擇的第一步是見更多的人，參加創(chuàng)…

12-29

中國自研CR450動車組亮相：時速400公里，全球最快高鐵列車來了！

12-29

DeepSeek V3“冒充”ChatGPT，OpenAI奧特曼：創(chuàng)新之路何其難！

三言科技 12月29日消息，近日剛發(fā)布的DeepSeek-V3認(rèn)錯家門，說自己是“ChatGPT”，而且目前這種bug仍然沒有修復(fù)。當(dāng)你不知道它是否行得通時，做一些新的、有風(fēng)險(xiǎn)的、困難的事情是非常困難的。這是…

12-29

支付寶AI年度總結(jié)：你的專屬夸夸信，情緒價(jià)值拉滿！

12-29

集運(yùn)運(yùn)價(jià)波動加劇，2025年市場面臨多重不確定因素挑戰(zhàn)

12-29

華碩二次元風(fēng)拉滿！ROG Z890主板搭載RO姬戰(zhàn)斗公主形象

12-29

"“愛達(dá)?魔都號”首航周年：載60萬旅客，國產(chǎn)郵輪新里程碑！"

12-29

廣西防城港海上風(fēng)電示范項(xiàng)目正式投產(chǎn)，年供電超70萬戶家庭！

12-29

點(diǎn)擊查看更多 +

全站最新

吉利遠(yuǎn)程發(fā)布全新醇?xì)潆妱臃桨?，續(xù)航破600公里，綠色出行新選擇！

吉利遠(yuǎn)程發(fā)布全新醇?xì)潆妱臃桨福m(xù)航破600公里，綠色出行新選擇！

寧德時代應(yīng)收賬款周轉(zhuǎn)天數(shù)連年攀升，如何應(yīng)對車企拖欠賬款壓力？

新吉奧房車即將港交所上市，上半年?duì)I收增超億，繆雪中家族持股近九成

TCL明年旗艦電視：萬象分區(qū)再升級，RGB-Mini LED技術(shù)或?qū)⒘料?/a>

比亞迪“夏”MPV形象代言人即將揭曉，實(shí)力派影帝究竟是誰？

小米16或補(bǔ)全短板，正評估搭載潛望式長焦鏡頭？

熱門內(nèi)容

本欄最新

寧德時代應(yīng)收賬款周轉(zhuǎn)天數(shù)連年攀升，如何應(yīng)對車企拖欠賬款壓力？

小米MK71 Pro機(jī)械鍵盤亮相：2025年1月1日眾籌，Gasket結(jié)構(gòu)+71鍵布局引期待

新款豐田蘭德酷路澤內(nèi)飾搶先看！全新儀表盤科技感爆棚

春節(jié)前A股布局良機(jī)？十大券商揭秘投資主線與策略

億航智能攜手中交信科，共筑低空經(jīng)濟(jì)與空中交通新生態(tài)

AI工程師熱搶中，他們?nèi)绾卧趧?chuàng)業(yè)與大廠間做出選擇？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

阿里云百煉上線音視頻實(shí)時互動功能，人人都能創(chuàng)建專屬多模態(tài)應(yīng)用

阿里云百煉上線音視頻實(shí)時互動功能，人人都能創(chuàng)建專屬多模態(tài)應(yīng)用