【ITBEAR】微軟近日獲得一項新專利,該專利構想了一種利用人工智能模型Copilot來為用戶創(chuàng)作與視頻、文本及PowerPoint等內(nèi)容相匹配的音樂或背景音樂的方法。這一創(chuàng)新技術被命名為《Artificial intelligence model for composing audio scores》,它探討了如何根據(jù)輸入的內(nèi)容來生成音樂。
專利文檔中詳細描述了技術的實現(xiàn)步驟:首先,系統(tǒng)會收集包含視頻和音頻的大量訓練數(shù)據(jù);接著,通過分析這些數(shù)據(jù)集,提取出如顏色、形狀、運動及場景等不同類型的特征;最后,Copilot將尋找這些特征之間的關聯(lián)性,例如特定場景通常伴隨的音樂類型,從而生成與新的視頻或文本內(nèi)容相匹配的音頻。
這項技術可廣泛應用于多個領域,如電影、電視節(jié)目的背景音樂自動生成,為商業(yè)廣告創(chuàng)作契合氛圍的音樂,游戲中動態(tài)配樂的制作,以及通過音頻增強虛擬現(xiàn)實中的沉浸式體驗等。在日常生活中,它也能為特定場合如求婚等自動匹配合適的音樂,增添氛圍。