一圖做電影 上海的人工智能產業正不斷加速壯大

MiniMax緊盯底層模型加速迭代,旗下海螺AI訪問量全球居首
一圖做電影,每日生成視頻數百萬條
■上海人工智能產業規模已突破4000億元,規模以上企業超350家。上海的AI宇宙正在加速壯大,更多激動人心的故事正在續寫
DeepSeek的走紅,如同一顆超新星爆發,釋放出巨大能量,瞬間照亮了中國的AI星系。在上海人工智能的群星中,稀宇科技(MiniMax)是頗為亮眼的那一顆。
DeepSeek以文字見長,MiniMax則在文本、視頻、語音多模態技術領域保持領先。今年1月的全球AI視頻產品榜中,MiniMax旗下海螺AI視頻網站全球訪問量位居榜首。截至2月上旬,MiniMax以每日生成數百萬條視頻佔據全球第一寶座,每日生成語音量位居國內前二,文本處理量也位居國內前列。
在全世界競爭最激烈的領域,這家上海公司如何一步步提升競爭位次,在細分賽道超越頂尖同行?
用一張照片“拍”出電影
用人工智能生成視頻,是許多人樂於嘗試的應用。但AI的技術缺陷也引來很多吐槽:“上一段視頻中生成的是張三,下一段視頻就變成了另一張臉。無論怎麼調整,都無法讓兩段視頻的主角變成同一人。”
直到今年1月MiniMax發布最新視頻模型,將這一難題徹底化解。用戶隻需提供1張人物的正面照片,不論生成多少段風格迥異的視頻,主角都是這個人。這讓網友驚呼,一張照片就能做電影,這不是夢!
在創業過程中,MiniMax始終堅持技術驅動。動態視頻中如何保持人物面部多角度的真實度和穩定性,如何保持人物角色高度一致……痛點就是MiniMax攻關的重點。開發團隊進行了大量技術探索,比選不同的技術路徑,最后開發出S2V模型——隻需傳統方案1%的輸入量和計算成本,“上傳1張圖片”的效果就足夠好。
在3年多時間裡,一次次迭代升級,文生視頻、圖生視頻、主體參考等功能持續優化。這些創新,讓海螺AI視頻在激烈競爭中殺出重圍,使用量反超OpenAI的Sora,用戶分布在全球超200個國家和地區。
在文生語音等功能上,MiniMax也走出了差異化路線。網友發現,MiniMax的語音功能竟然帶有情緒調節和效果器功能,AI生成的語音可以帶上開心、難過、生氣等情緒,這一創新讓有聲書和廣播劇的生產力大幅提升。
“通用人工智能不是簡單的互聯網流量變化,而是計算范式的顛覆式創新,將會引領生產力、社會分工以及產業結構的深刻變革。”MiniMax創始人閆俊杰說。
畫自己的圖紙建造大廈
算力、算法和數據是人工智能發展的“鐵三角”。MiniMax創立之初,算力和數據十分有限,唯一選擇就是在算法上求突破。從2023年夏天開始,公司將80%的算力與研發資源投入底層架構研發,這在外人看來就像一場豪賭。
“我們在工程上遇到的很多問題,源於一片漆黑的未知。”公司技術團隊在沒有成熟經驗可供借鑒的情況下,一次次試錯,持續進行摸索。 下轉 3版(上接第1版)一年后,公司成功推出國內首個基於MoE架構的模型,研發人員又向“注意力機制”難題發起沖擊。今年1月,大規模實現線性注意力機制的MiniMax-01模型誕生。這是中國公司首次突破傳統Transformer架構,並逐漸為行業廣泛認可。
“底層模型能力是決定大模型應用成功與否的首要因素。”MiniMax副總裁劉華告訴記者,雖然照著現成的圖紙蓋樓相對容易,但圖紙的不足也會限制樓房的高度。我們選擇用自己的圖紙構筑大廈,一開始或許慢一些,但希望能更好應對未來的挑戰。
底層架構如同AI“新基建”,MiniMax-01模型突破了長文本處理瓶頸,可高效處理最長400萬token(詞元)的上下文。在工業領域,該模型可以快速解析百萬字設備日志,輔助故障診斷﹔在醫療場景,它可連續跟蹤患者數年病歷,生成個性化治療方案。
最近兩年,大模型技術快速迭代,國際國內AI行業都在白熱化競爭。底層模型一次重大迭代對產品帶來的優化效果,會遠超在工程實現層面對產品進行“雕花”。這也是MiniMax始終緊盯模型本身,加速迭代升級的重要原因。
借助上海優勢加快發展
作為上海人工智能高地孵化的代表性企業,MiniMax的成長離不開這座城市獨特的文化和基因。
上海匯聚了全球頂尖的AI人才,大量富有熱情的年輕人才,為產業快速發展提供了支撐。在MiniMax上海總部大樓,研發人員持續增多。2023年6月,還只是一層樓坐了半個樓面,后來很快坐滿兩層樓。從人工智能行業發展看,成功的模型,就脫胎於科學的做事方法、數百人技術團隊的有效組織、坦誠扎實的研發文化。
不久前,上海推出人工智能“模塑申城”實施方案,在算力、場景、數據、人才方面推出一批有力舉措。上海還積極推動大模型企業與場景企業對接。以MiniMax為例,他們與小紅書合作打造生成式智能搜索,與閱文集團合作將數千本小說變成超自然、高保真的有聲書等,通過相互賦能實現更快發展。
閆俊杰相信,“真正有價值的事,不是當前做得怎麼樣,而是技術進化的速度。”一如多年前的移動互聯網行業,在人工智能這個快速迭代的行業,民營科技企業展現出獨特價值,那就是以技術驅動實現快速發展,以靈活機制捕捉前沿趨勢,以務實創新解決產業痛點。
上海人工智能產業規模已突破4000億元,規模以上企業超350家。僅“模速空間”及周邊,就已聚集255家大模型企業和34個備案大模型。上海的AI宇宙正在加速壯大,更多激動人心的故事正在續寫。(記者 孟群舒)
分享讓更多人看到
- 評論
- 關注