人民網
人民網>>上海頻道>>經濟中心

兩年躋身“AI六小虎” 階躍星辰全方位闖關突圍

2025年02月21日18:28 | 來源:解放網
小字號

兩年躋身“AI六小虎”,要做最“卷”的多模態大模型

階躍星辰全方位闖關突圍

2月18日,AI大模型獨角獸企業階躍星辰旗下兩款多模態大模型宣布開源,其中包含全球范圍內參數量最大、性能最好的開源視頻生成模型階躍Step-Video-T2V,以及行業內首款產品級開源語音交互大模型階躍Step-Audio,一時間在全球開源社區內引發熱議。

相較於國內多數大模型企業,階躍星辰幾乎是個“小透明”,但憑借成立不足2年接連推出11款大模型,成功躋身“AI六小虎”之列,還被《麻省理工科技評論》評為“DeepSeek之外值得關注的四家中國人工智能初創公司”之一,認為其展現出不遜於DeepSeek的技術實力。

國內外“百模大戰”方興未艾之際,階躍星辰如何在短時間內突圍?

“卷”技術也“卷”人才

“階躍星辰在‘AI六小虎’(智譜AI、月之暗面、百川智能、MiniMax、階躍星辰、零一萬物)中成立比較晚,但我們要做最‘卷’的多模態大模型。”約定的採訪時間剛到,階躍星辰副總裁李璟一股風似的來到會議室,語速很快,創業者的精氣神扑面而來。

階躍星辰有多“卷”呢?春節前夕,DeepSeek正席卷全球時,階躍星辰也沒閑著,六天連發了六個模型,涵蓋語言、語音、推理、圖片理解、視頻生成等多類別。新模型不僅在階躍星辰最擅長的多模態領域繼續領跑,推理模型Step R-mini在視覺推理領域也取得突破性進展。

最近,全球大模型掀起了一陣開源潮,階躍星辰還將性能最好的兩款多模態大模型面向全球開發者開源。其中Step-Video-T2V參數量達到300億,可以直接生成204幀、540P分辨率的高質量視頻。Step-Audio語音模型在5大主流公開測試集中均超過了行業內同類型開源模型,尤其是在漢語水平考試六級評測中的表現尤為突出,堪稱“最懂中國話”的開源語音交互大模型。

“階躍星辰能在短時間內突圍,關鍵因素是高人才密度對創新的正向反饋。”李璟告訴記者,階躍星辰團隊成員隻有500余人,但算法和技術人員的比例接近80%,其中不乏行業內的“大牛”。

在C端闖出另一條路

與豆包、Kimi等大家熟知的大模型App相比,階躍星辰的躍問App知名度低了不少,但李璟表示壓力並不大。

“我們一直按照節奏來推進C端應用開發,創業公司要把有限的成本放在技術研發上,而不是投流和廣告。”在李璟看來,DeepSeek的爆火印証了一個觀點——模型即產品,模型性能就是產品能力,階躍星辰Step系列模型的優勢在多模態領域,躍問App更應該在圖像和視聽等差異化體驗上有所突破。

例如,躍問App提供的上海三日旅游攻略,不僅包含常見的文字介紹,還會生成圖文詳盡的攻略,游客通過拍照能了解景點更多資料,躍問App還能進行語音講解。

“我們的核心能力是面向C端用戶,但我們更願意與合作伙伴共同提供C端服務。”李璟表示,面對DeepSeek、豆包等國產大模型搶佔日益擁擠的C端賽道,階躍星辰正闖出另一條路。早在創立初期,階躍星辰在金融財經、內容創作、智能終端、消費電子等領域,已經和不少行業龍頭達成了合作意向。

面向金融財經領域,去年3月,階躍星辰與上海報業集團旗下界面財聯社圍繞AIGC(生成式人工智能)財經資訊、智能投研等領域推進大模型的應用落地。同時,階躍星辰還聯合國泰君安、界面財聯社推出業內首個千億級參數多模態証券垂直類大模型——君弘靈犀大模型,在行業內首個實現了將大模型能力全面融入客戶智能化服務體系之中。“我們和界面財聯社共同開發的AI智能體‘小財神’,是面向個人投資者最優秀的產品之一。”李璟說。

在消費零售行業,階躍星辰憑借多模態大模型的優勢,與茶百道探索安全巡檢等方面的場景應用。今年1月起,全國數千家茶百道門店接入Step-1V多模態理解大模型。數據顯示,Step-1V平均每天能夠為茶百道督導員節約75%的檢核時間。

2024年下半年,階躍星辰多模態API(編程接口)的調用量增長超45倍,Step系列模型積累了一批活躍的應用開發者,多個走紅社交網絡的AI應用,如“歌詞爆改機”“胃之書”“林間療愈室”等,均採用階躍星辰的多模態大模型。

上下樓就是上下游

“階躍星辰作為一家初創型民營企業,發展如此迅猛,離不開上海對算力、數據等基礎設施資源的投入和開放。”李璟告訴記者,上海早在2017年就確立了發展人工智能產業的願景,2018年舉辦首屆世界人工智能大會,這些舉措遠遠早於本輪生成式人工智能熱潮。

正是上海的前瞻性,孕育出健康完善的AI生態。記者在西岸智塔的銘牌欄上看到,微軟亞洲研究院(上海)、聯影智能、得帆科技等知名研發平台和頭部企業,都是階躍星辰的“鄰居”。僅一棟樓,就匯聚了數十家人工智能企業和科研機構,形成了集政、產、學、研、用於一體的AI垂直產業生態,“上下樓就是上下游”,讓階躍星辰能快速找到合作方、對接資源和獲取服務。

上海人工智能語料數據平台型企業庫帕思科技也在不遠處。庫帕思已全面啟動具身智能、金融、制造、教育、醫療、文娛、城市治理等領域的行業語料庫建設,語料運營1.0平台已投入實戰運營,正加快布局從真實世界到模擬仿真到數據合成平台2.0研制。目前,庫帕思已經鏈接了超過50家語料生態合作伙伴。智能算力方面,上海儀電投產了多個國內領先的“大規模、高等級”萬卡智算集群,為階躍星辰等大模型企業以及研究機構提供低成本算力服務。

“得益於上海市的整體統籌布局,我們和合作方聯合自建了大型的訓練集群,這是推動我們向更優模型邁進的關鍵基礎設施之一,也是與許多創業公司相比顯著的優勢所在。”李璟說。(記者 查睿)

(責編:嚴遠、軒召強)

分享讓更多人看到

返回頂部