人民網
人民網>>上海頻道>>文化| 體育

AI音樂“狂飆”,行業正在遭遇怎樣的沖擊?

2026年03月24日18:20 |
訂閱已訂閱已收藏收藏小字號

數十秒就能生成一段完整音樂,零基礎的人也能輕鬆發歌

AI音樂“狂飆”,行業正在遭遇怎樣的沖擊?

■AI正在淘汰的不是創作本身,而是低技術含量、可批量復制的工作,比如用於短視頻配樂、商業廣告等的功能性音樂

■在歌曲領域,真實的表達來自人類的情感與經歷。AI時常表現得循規蹈矩,而真人演繹時不免會有一些小瑕疵——而那些瑕疵背后,是很鮮活的東西

■站在平台視角,AI也在不斷推動行業發展、優化行業生態,讓大量過去沒有專業音樂創作能力的人也能創作出還不錯的音樂,反推更多專業從業者去產出比AI創作更好的音樂作品和內容

AI音樂,正以驚人的速度涌入市場。數據顯示,2025年,僅Suno一個制作軟件,用戶每天生成的歌曲就超過700萬首,相當於兩周就能生成近億首歌曲,體量驚人。

創作的門檻正變得史無前例地低。不久前,谷歌在旗下億級用戶產品Gemini中上線音樂生成功能:一句話、一張照片,數十秒就能生成一段完整音樂。去年年底,騰訊音樂旗下的AI創作工具“VEMUS未音”正式發布,主打讓零基礎的人也能輕鬆發歌。

在這股AI音樂洪流中,大量歌曲被打上“AI感強”“粗糙”的標簽,但也有一批作品讓人真假難辨,甚至被認為比真人演繹更有味道。當人與AI的聽感邊界日漸模糊,音樂制作行業會遭遇怎樣的沖擊?

誰在被取代?

在傳統音樂創作鏈條上,生成式AI的沖擊並非“平均用力”。

首當其沖的,是那些為平台量產歌曲的作詞、編曲的工種。“Suno這些平台確實很厲害,比很多詞曲作者高效得多。”廣東某唱片公司的音樂制作人Rey說。他口中的Suno,是目前全球最火的AI音樂生成平台之一。用戶隻需輸入簡單的歌詞和風格提示,幾十秒就能生成一首包含人聲、旋律、編曲的完整歌曲。“我認識的一些詞曲作者,要不就回老家了,要不就改行學別的了。”

音樂制作人莫芷銘身邊也有人因此失業。他注意到這背后創作模式的變化——以前一個公司要制作10首歌,需要找5個編曲人,每人編兩首。現在,公司用Suno10分鐘就能生成10首,快速篩選出兩首有潛力的,再讓人去臨摹和精修。“本來5個人的活,現在兩個人就能干。”

但產業鏈並非全線遇冷,某些工種反而表現出一定的抗壓性。比如混音。這是將多軌音頻通過專業處理,融合成富有層次和空間感的最終成品的環節。“其實混音行情反而更好了,有些人甚至轉行去做了混音。”Rey解釋,由於AI混音技術不成熟,在詞曲價格普降的情況下,制作公司更願意在混音這個仍需人工精雕細琢的環節上投入更多。

混音為何能守住陣地?Cashmere Studios是一家位於上海靜安區的專業音頻制作工作室,主理人卡卡告訴記者,混音涉及極為主觀的感性判斷,難以被算法完全量化。“客戶找混音師,就像買衣服時找閨蜜參謀,需要的是帶有個人審美和情感導向的建議,而非標准化的技術輸出。”

從技術角度看,混音這個環節尚未出現強有力的AI工具,其核心在於數據壁壘。“很多歷史數據難以獲得,比如某些專業軟件的混音插件、硬件設備的具體操作參數,第三方很難批量採集,整個混音過程類似一個‘黑盒’。”卡卡解釋。也就是說,要訓練一個能媲美頂級混音師的AI,需要海量、高質量且開放的操作數據,目前很難實現。

採訪中,幾名音樂人對AI的共識是:它正在淘汰的不是創作本身,而是低技術含量、可批量復制的工作,比如用於短視頻配樂、商業廣告等的功能性音樂。按照AI目前的技術水平,生成的歌曲就像一張大眾臉,工整、合格,但缺少辨識度與靈魂。而市場對這部分內容的需求,正在被AI高效滿足。

卡卡說,最近兩年一些獨立音樂人的收入來源明顯減少。“因為和企業合作的商單少了,比如企業內部的活動歌曲制作,企業改為直接用AI軟件生成。”Cashmere Studios自身的業務結構也在發生變化,與影視、游戲公司的合作也有一定程度的收縮。“以前大多數公司會採買一些版權音樂,或找樂手合作來做演奏嘗試,現在越來越多公司直接借助AI找靈感、做小樣。”

資深玩家進化

技術躍遷的速度,決定著行業震蕩的程度。資深玩家正在進化。Suno V5付費使用的Suno Studio專業模式,能實現對生成歌曲的精細化調整。用戶能在不影響其他部分的情況下,重新生成歌曲的特定片段,無論是主歌、副歌還是橋段。同時,模型支持一鍵拆分最多12條原始音軌,可精准提取生成音頻中吉他、鼓、貝斯、合成器等多種樂器軌道。這大大方便了音樂工作者,無論是二次編曲,還是后期混音,都能直接應用,效率倍增。

更大的變量,在於平台方的入局。今年2月,谷歌宣布其Gemini應用正式集成DeepMind旗下音樂生成模型Lyria 3。用戶可以“描述一個想法”,指定某種風格、情緒或節奏,模型就能自動生成歌曲﹔用戶也可以上傳照片或視頻,Lyria 3會通過分析畫面氛圍,創作出契合場景的配樂。所有生成的曲目都使用SynthID技術添加了不易察覺的水印,便於檢測AI創作內容。

谷歌之外,國內音樂平台也未缺席這場競賽。比如,QQ音樂內嵌“AI作歌”功能,用戶可搜索直達,提供“一句話”“填詞”“圖片”“哼唱”等生成方式。“這類用戶有自我表達的訴求,就像過去寫日記、拍照一樣,音樂也成了他們的一種記錄方式。”騰訊音樂VEMUS未音業務負責人Lillian說。

去年年底,騰訊音樂旗下AI創作工具“VEMUS未音”正式發布,定位與Suno形成微妙錯位——Suno逐漸向專業生產者傾斜,而VEMUS希望降低音樂創作門檻,讓更多人有機會用音樂進行自我表達。“很多用戶內心想寫歌,但不太會定義風格,就像現在很多人不太會問AI問題一樣。”Lillian說。為此,VEMUS給用戶做了更簡單的設計:用戶可以參考自己常聽的歌曲,讓模型從中提取風格靈感。系統會總結當前熱點的風格配方,一鍵調配,甚至可以通過對話的方式,聊著聊著就作出一首歌。

隨著AI工具的“狂飆”,有人被迫出局,也有人奮力追趕。莫芷銘將AI用作靈感催化劑,“如果自己要創作一首歌,能想到的元素肯定沒有AI多,速度也沒有AI快,那就讓它生成五六個版本,來刺激我的大腦。”而Rey選擇深入技術的腹地,研究如何“跑本地模型”。從電力系統專業出身,到轉行做音樂,再到如今研究代碼,他一直沒有停下。

重構收益規則

當AI生成的海量作品試圖流向市場換取回報時,它們會撞上一堵牆——一套尚未適配、仍在重構的收益規則。

曾經,AI音樂在國內平台基本處於零分成狀態。現實正在發生變化:部分平台已開始試水AI音樂商業分配。比如,網易雲音樂推出AI歌曲專屬激勵金活動,符合要求的AI作品可參與收益分配﹔抖音旗下汽水音樂則依托短視頻生態,為AI音樂提供播放收益與BGM使用分成。

即便如此,AI音樂的商業化仍面臨雙重困境:一是版權與收益規則不清,二是內容質量參差不齊。

業內人士解釋,現有的商業模式、合作協議、版權授權機制,都是基於傳統音樂創作模式建立的。AI音樂的出現,打破了這一體系。同時,內容質量也是繞不開的門檻。大量AI生成的歌曲仍帶有明顯的機器味,難以與真人作品競爭主流商業市場。

實際上,AI音樂能不能賺錢這個問題,不隻在於規則制定。莫芷銘提出疑問:“如果一首歌明顯是百分之百AI生成的,為什麼要分成?”

在海外,甚至有平台明確對AI音樂說“不”。今年1月,知名獨立音樂平台Bandcamp宣布,禁止AI生成的音樂上架,還規定“完全或主要由AI生成的音樂和音頻”不允許發布,任何使用AI工具模仿其他藝術家或風格的行為也被嚴格禁止。Bandcamp在聲明中強調,此舉是為了保護真實的人類創作者社群,讓樂迷能夠確信他們在平台上聽到的音樂“是由人類創作的”。

爭議之下,行業並未停下腳步。盡管AI音樂收益機制尚不成熟,仍有不少機構和創作者在持續布局AI音樂,部分作品進入熱門榜單,還有平台已經捧出了自己的AI音樂人。為什麼?

“這背后有幾個驅動因素。”Lillian分析,一是佔位,很多公司或個人認為AI音樂是未來方向,提前布局,嘗試跑出爆款﹔二是內容試驗,有些人用AI生成大量歌曲,測試用戶反饋,甚至有些作品質量不錯﹔三是自我表達,普通用戶用AI工具創作音樂,更多是情感記錄或社交分享,而非商業目的。

與此同時,AI音樂的普及也帶來“洗歌”“刷量”等濫用行為。對此,平台也在不斷升級技術能力,來識別和治理低質量、侵權內容。

“我們正在觀察用戶的選擇和行業的發展。如果AI音樂足夠優質,能夠被用戶喜愛,它自然會進入榜單。未來,我們也可能為AI音樂設立專屬榜單,甚至探索新的廣告模式、商業化路徑。”Lillian說。

回歸人的價值

這場AI對音樂行業的重塑,正觸及一個更深層的結構性問題——職業階梯的斷裂。

卡卡觀察到:“AI可能會導致嚴重的人才斷檔。”過去,音樂人可以從接小型項目、寫定制化的商業歌曲起步,慢慢積累經驗爬升到金字塔頂端。但現在,這些“練手級”的機會正在被AI生成的音樂大規模蠶食。“成為專家的那條路徑變窄了,很多人開始考慮轉行,或者加入AI音樂制作的大軍。”

這意味著,未來的音樂行業可能呈現出啞鈴型結構——一端是擁有個人IP和不可替代審美的少數人,另一端是使用AI工具批量生產的人,而中間層的生存空間正被急劇壓縮。站在平台視角,Lillian則認為,AI在不斷推動行業發展、優化行業生態,讓大量過去沒有專業音樂創作能力的人也能創作出還不錯的音樂,也反推更多專業從業者去產出比AI創作更好的音樂作品和內容。

這兩種觀察並非矛盾,而是同一枚硬幣的兩面:傳統的職業中間層或許在縮小,但一個由AI賦能的新手和跨界者構成的大眾創作中間層正在出現。這背后,指向專業從業者角色的深刻遷移——從“如何做”的執行者,被推向“做什麼、為什麼做”的決策者。審美、情感和獨立品格,正在成為更稀缺的核心能力。正如硅谷著名天使投資人納瓦爾在一檔播客中所言,AI沒有肉身,沒有欲望,沒有生存本能,本質上依然是“人類知識壓縮機和模仿者”。

“在歌曲領域,真實的表達來自人類的情感與經歷。AI時常表現得循規蹈矩,而真人演繹時不免會有一些小瑕疵——而那些瑕疵背后,是很鮮活的東西。”卡卡說。

一個明顯的趨勢是,越強調人的連接性的工種,抗風險能力越強。

身兼多職的音樂人莫芷銘在採訪中展現得很從容,他的主要精力放在需要深度溝通的專輯制作和藝人演唱會演出上,這類工作高度依賴個性化溝通。“藝人有明確的表達意圖,音樂需要與現場的視頻、燈光、特效以及很多工種緊密協作。像Suno這類工具,目前還處理不了如此細致、綜合的創作需求。”

卡卡決定將工作室的未來方向錨定在“人與人的深度交流”上,計劃打造更大的公共活動空間。“當套路化音樂充斥市場,人們過度沉浸在虛擬世界中,‘物極必反’的規律將會生效。”他依然希望,大家能回歸真實的、面對面的線下溝通。

(來源:解放日報 記者 束涵 見習記者 余敏之)

(責編:嚴遠、軒召強)

分享讓更多人看到

返回頂部