給一段話就能譜一首曲:下一個(gè)AI顛覆性應(yīng)用發(fā)生在音樂領(lǐng)域?|科技創(chuàng)新世界潮

2023-02-13 15:21:28 來源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù):

科技日?qǐng)?bào)實(shí)習(xí)記者?張佳欣

過去幾年里,人工智能(AI)在創(chuàng)意領(lǐng)域的應(yīng)用出現(xiàn)了爆炸性增長。新一代圖像和文本生成器不斷給人驚喜。現(xiàn)在,AI正在下一個(gè)領(lǐng)域掀起浪潮。


圖片來源:英國 DJ Mag 網(wǎng)站

近期,谷歌的一個(gè)研究團(tuán)隊(duì)發(fā)布了新的AI模型MusicLM,這是一種可將文本信號(hào)轉(zhuǎn)換為音頻片段的音樂生成器。繼ChatGPT之后,音樂或?qū)⒊蔀锳I生成的前沿領(lǐng)域。這是創(chuàng)意AI在短短幾年內(nèi)創(chuàng)新步伐飛速的又一個(gè)例子。

傳統(tǒng)音樂行業(yè)仍在適應(yīng)互聯(lián)網(wǎng)和流媒體服務(wù)帶來的巨大沖擊,AI會(huì)改變?nèi)藗儎?chuàng)作和體驗(yàn)音樂的方式,使音樂行業(yè)再次復(fù)興嗎?

把文字變音樂的AI“藝術(shù)家”

最近爆火的聊天機(jī)器人ChatGPT或許還無法制作音樂,但谷歌的MusicLM可以。

這一AI“藝術(shù)家”可根據(jù)不同地點(diǎn)、時(shí)代或要求創(chuàng)作音樂。其樣本由指定音樂流派、音樂氣氛甚至特定樂器的長段旋律組成。

當(dāng)MusicLM“聽到”某人吹口哨、哼唱、演唱或是演奏樂器后,能從中推斷出額外的旋律小節(jié)。它可調(diào)節(jié)樂器的種類,甚至是演奏的力度。它還可創(chuàng)建一曲連續(xù)音樂即興表演的“故事”,例如創(chuàng)作“在電子游戲中播放的電子歌曲”“在河邊播放的冥想歌曲”、表達(dá)意境為“火”和“煙花”等音樂。

MusicLM甚至可產(chǎn)生適合視覺藝術(shù)的聲音。例如,它根據(jù)薩爾瓦多·達(dá)利的名畫《記憶的永恒》和雅克-路易·大衛(wèi)的《跨越阿爾卑斯山圣伯納隘道的拿破侖》的描述創(chuàng)建了配樂。


MusicLM可以產(chǎn)生適合視覺藝術(shù)的聲音。例如它根據(jù)薩爾瓦多·達(dá)利的《記憶的永恒》和雅克-路易·大衛(wèi)的《跨越阿爾卑斯山圣伯納隘道的拿破侖》的描述創(chuàng)建了配樂。
圖片來源:美國在線媒體Voicebot.ai

AI生成音樂史上的重要突破

AI生成音樂有著悠久的歷史,甚至被認(rèn)為是創(chuàng)作熱門歌曲和助力現(xiàn)場表演的“功臣”。

在MusicLM之前,已經(jīng)有其他嘗試?yán)肁I生成音樂的嘗試,比如谷歌發(fā)布的AudioML和OpenAI的Jukebox,視覺和聲音AI項(xiàng)目Riffusion則使用穩(wěn)定擴(kuò)散將文本提示轉(zhuǎn)換為聲圖。還有一些AI工具可將生成式AI和音樂結(jié)合在一起,比如Voicesmod的合成歌曲生成器,它可將提交的歌詞與一系列流行歌曲和AI聲音進(jìn)行匹配。

不過,谷歌研究人員在論文中也提到了AI音樂生成面臨的各種挑戰(zhàn)。相比從文本到圖像的機(jī)器學(xué)習(xí),缺乏配對(duì)的音頻和文本數(shù)據(jù)是一大障礙。此外,音樂是“沿著時(shí)間維度”構(gòu)建的,讓AI了解文本表達(dá)的意圖,創(chuàng)作出一段符合主題的持續(xù)的音樂要困難得多。

MusicLM是克服挑戰(zhàn)的重要一步。據(jù)極客邦科技網(wǎng)站報(bào)道,MusicLM將有條件的音樂生成過程建模,變?yōu)榉謱有蛄械叫蛄薪#簿褪钦f,它使用機(jī)器學(xué)習(xí)為歌曲的不同層次生成序列,如結(jié)構(gòu)、旋律和單獨(dú)的聲音,并在幾分鐘內(nèi)以恒定的24千赫茲創(chuàng)建音樂。

AI會(huì)取代人類創(chuàng)作音樂嗎

目前,自動(dòng)化創(chuàng)作音樂的技術(shù)已經(jīng)在快速發(fā)展。AI工具可能會(huì)給藝術(shù)家提供更好的靈感。

但眾所周知,機(jī)器學(xué)習(xí)技術(shù)如同一個(gè)非常難以預(yù)測的“盲盒”。澳大利亞《對(duì)話》雜志發(fā)文稱,使用AI生成音樂只是目前的一次“幸運(yùn)的探險(xiǎn)”。使用這些工具時(shí),人們有時(shí)可能會(huì)發(fā)現(xiàn)黃金,但不知其中的原理是什么。藝術(shù)家們現(xiàn)在不得不接受“潘多拉魔盒”已經(jīng)被打開的現(xiàn)實(shí),就像當(dāng)初合成器和電子鼓第一次出現(xiàn)時(shí)一樣,在某些情況下,它可能會(huì)部分取代對(duì)音樂家的需求。

但目前,MusicLM還無法與人類作曲家匹敵,尤其是在歌詞創(chuàng)作方面。美國專注于語音智能的在線媒體Voicebot.ai評(píng)論稱,MusicLM生成的歌詞充其量只是亂碼,甚至是在胡謅。谷歌研究人員也承認(rèn),MusicLM大約1%的創(chuàng)作內(nèi)容只是在單一地復(fù)制現(xiàn)有的音樂。

因擔(dān)心版權(quán)風(fēng)險(xiǎn)以及道德問題,谷歌表示目前沒有立即發(fā)布MusicLM的計(jì)劃。有法律版權(quán)專家表示,AI系統(tǒng)音樂可被視為衍生作品,在這種情況下,只有原創(chuàng)元素才會(huì)受到版權(quán)保護(hù)。不過,如果藝術(shù)家的作品在其不知情或未經(jīng)他們同意的情況下被用來訓(xùn)練AI系統(tǒng),那么AI音樂生成器還可能面臨涉及侵權(quán)的訴訟。如果沒有監(jiān)管,這很可能成為音樂行業(yè)的另一個(gè)灰色地帶。

責(zé)任編輯:常麗君

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會(huì)影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí),繼續(xù)瀏覽

繼續(xù)瀏覽