懂企業,和企業一起走通一條路

DeepSeek橫空出世后,熱度一直不減,令AI大模型企業振奮,也令國人興奮和自豪。
網友並非隻追互聯網熱梗,很快總結出DeepSeek誕生的背后有一支“悶聲干大事”的團隊,以及一個“無事不擾、有求必應”且足夠有耐心的政府。
上海是否有類似的故事?最有發言權的是上海本土的AI大模型企業。大家給出的真實反饋是,上海以人工智能產業的發展能級和這座城市骨子裡的實干精神,正在書寫著自己的故事。
在浦東、徐匯、楊浦以及臨港新片區等上海人工智能產業發展的重點區域,企業聚焦芯片、大模型、人形機器人等前沿技術,正在創造屬於自己的“核爆點”。
算力和語料還重要嗎
“每年春節都有驚喜,去年是OpenAI的文生視頻大模型Sora,今年就是我們中國自己的推理大模型DeepSeek-R1。”在位於徐匯西岸的中國首個大模型創新生態社區“模速空間”,DeepSeek不僅是熱議的談資,更是會實打實接入各家企業自研大模型的重要幫手。
自2023年9月揭牌以來,模速空間僅用38個晝夜,就實現一期近1萬平方米空間從毛坯到讓企業拎包入住。截至2024年底,這裡已有255家大模型企業、34個備案大模型、100余家投資機構成功落地,未來將建成10萬平方米的產業空間。
首批入駐模速空間的秘塔科技是一家AI搜索大模型研發企業。除夕夜,他們就接入了“滿血版”的DeepSeek-R1。公司首席運營官王益為說,DeepSeek擅長的深度思考能力可在秘塔既有的AI搜索基礎上,對不同的可信數據源之間進行比較推理並提出觀點,頗具啟發性,能幫助開發者更好地優化其自研大模型。
記者採訪模速空間多家AI大模型企業時發現,大模型開發者之間雖有競爭或理念差異,但對整個行業裡程碑式的跨越都有一種惺惺相惜的感觸。大模型開發與其他許多科創行業一樣,都需要一顆赤子之心,一股“板凳須坐十年冷”的堅持。
再看過去半個月裡“老生常談”的問題:DeepSeek用強大的算法打破了“唯算力論”的限制,算力和語料還重要嗎?都說上海發展大模型的優勢在於應用場景,基礎模型的發展水平又如何?
模速空間內,來自大模型應用層的企業認為,應用端始終是上海的強大優勢,但Minimax、階躍星辰等上海基模企業的開發能力同樣強大。“對於真正想做好大模型、想干事的人來說,他人的成功一定是激勵,而非震懾。”一位大模型從業者總結。
“算力重不重要”的答案更顯而易見。一位開發者舉例:如果用600億—700億規模的參數來更新一個模型,幾百張卡的算力需要一個月后才能得出實驗結果。如果使用萬卡級別的算力,2天就能完成。“同樣的時間,別人訓練一次模型用時3小時,而你花了3天,那麼別人就能得出更多結果、試驗更多變化。”
為此,徐匯區正依托模速空間,打造具備九大算力合作伙伴、超5萬張卡的算力調度平台,全區規劃30EFLOPS算力資源,在區級層面充分托舉大模型企業。
實打實的算力補貼
在模速空間A區的公共休閑區,記者與一位剛來此一年多的海歸大模型創業者聊天時,對方連說了兩次“上海是中國最重視AI的城市”。
對企業來說,“重視”最直接體現在真金白銀上。以模速空間為例,除了租金支持和來自徐匯資本、臨港集團的投資外,還有一項對所有大中小企業來說都稱得上“驚艷”的服務:實打實的算力補貼。
“創業6年,搬來模速空間后,我才第一次真真正正拿到了算力補貼。”模速空間一位大模型企業的聯合創始人向記者感嘆。此前,他帶領團隊在其他地方參加過幾次大模型比賽,試圖拓寬獲取算力的渠道。“最后大家都拿著‘大支票’一起照相了,結果允諾的補貼沒有了下文。”
為何光“履行算力補貼承諾”一項服務,就足以讓企業拍手稱贊?給企業省錢是一方面,大模型還是一個與時間賽跑的產業,獲取算力越便利,意味著訓練模型時跑完一次模型的用時越短。這直接關系到模型優化與迭代的效率,更決定著能否搶佔市場先機。
“有算力補貼是真給”的不隻有模速空間一家。在位於浦東張江的大模型產業生態集聚區“模力社區”,人工智能領域的高端人才團隊最高可獲得700萬元的個人及團隊贊助以及最高1億元的項目補貼。
有網友討論何謂“最懂科技企業的政府”。在上海AI大模型企業眼中,知道企業缺什麼,且能隨時為企業補位、補鏈的政府,何嘗不是“最懂企業”。
不少大模型企業希望,接下來上海能從區級層面開始,加大真實場景和數據的開放。還有一項當務之急:為傳統企業實現數字化賦能。“上海企業多、企業質量好,在借助大模型工具加快數字化轉型方面大有可為。”
把一條路走到極致
企業越發多樣且專業化的訴求,倒逼政府職能部門的干部們不斷學習,加強專業服務能力。
記者採訪過不少科創企業、AI企業,隻要提前做足功課,提的問題專業,企業其實很樂意與記者聊關於數字人、大模型,以及更加精深的專業領域話題,從成本投入到業績分析都願意分享。
科創企業對於媒體採訪是這樣,對於區、街道招商服務人員上門服務、政府部門舉辦座談會等,也是如此。“你懂我,我們才能在一個頻道交流互動﹔當我有需要的時候,才可能得到實實在在的幫助”。
對於DeepSeek的成功,有位大模型開發者的話令記者印象深刻。“通過極致的軟硬件性能優化與適配,把這樣一條一開始並非所有人都看好的路走通了。”
把一條路走到極致,常常要經歷漫長的時間。其間會有不少企業因資金鏈斷裂或喪失信心而中途放棄。是幫助更多企業堅持到黎明之后,還是尊重市場自然的優勝劣汰規律?這既考驗政府把握“為與不為”的尺度,更考驗其對產業的戰略眼光。
但眼前已有不少好建議。有融資已經超過10億元的大模型企業建議,類似模速空間這樣的平台要更緊密關注初創階段資源少、資金緊的團隊,保持大模型產業的生態梯度。
還有企業提出,希望上海進一步優化大模型企業的容缺容錯機制,尤其針對大模型的“知識幻覺”所造成的信息偏差、用戶投訴,能給予企業一定的容錯機會並讓其及時糾正。
“大家都在為這個行業好”,在上海大模型領域,在各區相關產業區域,這早已是共識和行為准則。(記者 舒抒)
分享讓更多人看到
- 評論
- 關注