【ITBEAR科技資訊】4月2日消息,昆侖萬維集團(tuán)今日正式公布,其最新研發(fā)的音樂生成大模型“天工SkyMusic”即日起啟動(dòng)免費(fèi)邀測活動(dòng)。據(jù)悉,此次邀測將向行業(yè)媒體、專家及廣大音樂愛好者開放1000個(gè)免費(fèi)名額,以供用戶體驗(yàn)與測試。正式版本則預(yù)計(jì)在4月17日,隨著昆侖萬維旗下重磅產(chǎn)品「天工3.0」的發(fā)布,同步向全社會(huì)免費(fèi)開放。
天工SkyMusic被譽(yù)為目前國內(nèi)唯一一款公開可用的AI音樂生成大模型。據(jù)ITBEAR科技資訊了解,該模型采用了音樂音頻領(lǐng)域的類Sora架構(gòu),其中包含Large-scale Transformer與Diffusion Transformer兩大核心組件。Large-scale Transformer主要負(fù)責(zé)譜曲環(huán)節(jié),通過深度學(xué)習(xí)Music Patches的上下文依賴關(guān)系,實(shí)現(xiàn)音樂創(chuàng)作的可控性;而Diffusion Transformer則擔(dān)綱演唱部分,借助LDM技術(shù)將Music Patches還原為高質(zhì)量音頻。這一創(chuàng)新架構(gòu)使得天工SkyMusic能夠生成長達(dá)80秒、44100Hz采樣率的雙聲道立體聲歌曲。
天工SkyMusic的亮相,帶來了五大令人矚目的特點(diǎn):其一,能夠生成高質(zhì)量AI音樂,以80秒44100Hz采樣率雙聲道立體聲呈現(xiàn);其二,人聲合成效果驚艷,“以假亂真”的程度令人難以置信,中文發(fā)音尤為清晰準(zhǔn)確;其三,具備歌詞段落控制能力,生成的歌曲能夠清晰反映出不同歌詞段落的情感變化;其四,支持多樣化的音樂風(fēng)格創(chuàng)作,涵蓋說唱、民謠、放克、古風(fēng)、電子等多種類型;其五,擁有出色的音樂智能表達(dá)能力,可以學(xué)習(xí)并掌握顫音、歌劇、吟唱、男女對唱以及自動(dòng)和聲等多種歌唱技巧。
在AI音樂生成領(lǐng)域,另一款名為Suno V3的工具也于上月末引起了廣泛關(guān)注。這款被譽(yù)為“音樂版ChatGPT”的工具,能夠根據(jù)用戶提供的歌詞生成不同曲風(fēng)和流派的歌曲,甚至允許用戶定制AI歌手的音色。隨著天工SkyMusic和Suno V3等AI音樂生成工具的陸續(xù)亮相,AI技術(shù)在音樂創(chuàng)作領(lǐng)域的應(yīng)用正逐漸走向成熟和多樣化。