在上海,語料如何像水電煤一樣便利?
訂閱已訂閱已收藏
收藏“好語料如何形成?好應用如何涌現?”
“讓更多優秀創意在上海匯聚、更多創新成果在上海落地、更多青年人才在上海成長。”
“產業競爭正在從‘拼算法’向‘拼數據’轉變,高質量語料數據已成為人工智能發展的重要勝負手。”
3月28日,2026全球開發者先鋒大會“語料筑基、智生時代”主題論壇在上海舉行。本次論壇以“語料筑基、智生時代”為主題,聚焦語料數據如何更好支撐模型訓練、智能體開發和場景落地,重點突出應用導向、普惠開源和生態協同。
上海,正不斷推進語料像“水電煤”一樣便利。

豐富AI+場景征集,舉辦賽事推動競爭
上海市國資委副主任、一級巡視員陳東在致辭中表示,當前以大模型、多模態、智能體為代表的新一輪人工智能技術正在加快演進,國資國企既是產業發展的推動者,也是技術應用的重要場景提供者。
近年來,上海持續深化國企AI+行動,推動AI應用從“單點突破”向“系統賦能”躍升,重點從強化基礎支撐能力、促進場景開放共建、營造開放協同創新生態三個方面持續發力。希望通過本次論壇和大賽,讓更多優秀創意在上海匯聚、更多創新成果在上海落地、更多青年人才在上海成長。
上海市經信委副主任潘焱在致辭中表示,當前人工智能正加快進入應用落地新階段,產業競爭正在從“拼算法”向“拼數據”轉變,高質量語料數據已成為人工智能發展的重要勝負手。近年來,上海持續實施“模塑申城”工程,在語料供給、平台建設和生態營造等方面取得顯著成效。下一步,上海將圍繞語料關鍵技術攻關、行業高價值流程語料建設和OPC等新業態培育持續發力,更好支撐模型訓練、智能體開發和行業應用。
過去一年,模塑申城語料普惠計劃持續為中小企業、高校師生、創新創業者提供低成本、高質量、可持續的語料服務。今年,該計劃正式升級至2.0版本,延續“普惠、創新、鏈接”的總體要求,在原有基礎上進一步增強應用導向。聚焦科學智能,提供“高真值、多模態、過程化”語料數據供給服務﹔面向OPC群體,提供更加輕量化、低成本的語料服務支撐。按照規劃,到2027年底,計劃將鏈接服務500個創新主體,打造300個稀缺數據集,面向社會普惠提供語料價值不少於1.5億元,語料規模超過10PB。
2026 CICC語料數據智能創意大賽暨MinerU數據智能與前沿語料挑戰賽啟動。本屆大賽聚焦語料數據智能創新與前沿應用探索,面向開發者搭建交流展示、同台競技和成果轉化的平台。
大賽圍繞“語料支撐、場景牽引、應用落地、生態共建”的發展路徑,設置三個賽道:MinerU數據智能與前沿語料挑戰賽、場景開放與行業應用挑戰賽、智能體開放主題黑客鬆挑戰賽。大賽也將進一步面向社會尋找好場景、好應用、好技術、好團隊。
國資國企擁有豐富的業務場景、數據資源和應用需求,是推動人工智能賦能實體經濟的重要陣地。
2026國資國企AI+場景征集正式啟動,進一步面向重點行業、重點企業、重點任務梳理形成一批可落地、可復制、可推廣的AI+應用場景,推動真實業務需求加快轉化為模型訓練需求、智能體開發機會和產品落地空間。
幫助科研進步,讓OPC開箱即用高質量語料
圍繞科學智能發展需求,論壇舉行共建高質量科學數據簽約儀式。
當前,科學研究正加快從“文獻驅動”邁向“數據驅動、模型驅動、實驗驗証驅動”深度融合的新階段。此次簽約將進一步把上海在科學智能領域的優勢資源組織起來、聯動起來,推動高質量科學數據的匯聚、治理、加工與應用,為AI4S發展夯實數據底座。
簽約代表來自上海市研發公共服務平台管理中心、上海人工智能實驗室、蛋白質科學研究(上海)設施、上海科學智能研究院、上海創智學院及相關科研機構和企業。
徐匯作為上海人工智能創新策源的重要載體,正加快打造更加便捷、高效、可獲得的語料服務體系。當天發布的徐匯語料惠享專區,專為徐匯區AI企業打造,重點服務OPC創業者,提供開箱即用的AI-ready高質量語料。
專區推出“三重惠享”:一是經評估的OPC創業者最高可獲50萬元語料服務包,二是AI企業通過專區採購語料最高立減90%,三是提供30%語料券補貼,疊加市級政策后最高可獲得60%資金扶持。同時,徐匯向經認定的高質量語料供給方提供年度最高500萬元支持。
作為面向語料行業的重要年度遴選活動,語料風雲榜已連續舉辦兩年,一批好企業、好產品從中脫穎而出。今年,2026語料風雲榜再次啟航,將繼續圍繞“好企業、好產品、好規則”的基本框架,在未來三個月開展征集與遴選,並於2026世界人工智能大會期間正式發布“2026中國語料生產商風雲榜TOP10”“2026中國語料服務商風雲榜TOP10”。
此外,來自科研機構、創新平台、產業企業、投資機構和創業一線的專家,圍繞科學數據建設、數據加工技術、行業場景落地、未來產業投資、OPC生態位重構、數據潛能釋放以及具身智能發展趨勢等議題展開深入交流。
論壇討論既聚焦高質量語料數據如何更好支撐模型訓練和智能體開發,也關注人工智能如何加快駛入城市交通等真實場景﹔既討論“好數據”如何形成,也回應“好技術”如何突破、“好應用”如何涌現。
圓桌對話進一步把視角延伸到具身智能前沿,從技術成熟度、產業節奏、產品形態到生態機會,圍繞“具身智能的ChatGPT時刻:漸近,還是已至?”展開交流,呈現出從語料底座、技術能力到行業應用、產業生態的完整鏈條。
分享讓更多人看到
- 評論
- 關注
































第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量