在上海,语料如何像水电煤一样便利?
订阅已订阅已收藏
收藏“好语料如何形成?好应用如何涌现?”
“让更多优秀创意在上海汇聚、更多创新成果在上海落地、更多青年人才在上海成长。”
“产业竞争正在从‘拼算法’向‘拼数据’转变,高质量语料数据已成为人工智能发展的重要胜负手。”
3月28日,2026全球开发者先锋大会“语料筑基、智生时代”主题论坛在上海举行。本次论坛以“语料筑基、智生时代”为主题,聚焦语料数据如何更好支撑模型训练、智能体开发和场景落地,重点突出应用导向、普惠开源和生态协同。
上海,正不断推进语料像“水电煤”一样便利。

丰富AI+场景征集,举办赛事推动竞争
上海市国资委副主任、一级巡视员陈东在致辞中表示,当前以大模型、多模态、智能体为代表的新一轮人工智能技术正在加快演进,国资国企既是产业发展的推动者,也是技术应用的重要场景提供者。
近年来,上海持续深化国企AI+行动,推动AI应用从“单点突破”向“系统赋能”跃升,重点从强化基础支撑能力、促进场景开放共建、营造开放协同创新生态三个方面持续发力。希望通过本次论坛和大赛,让更多优秀创意在上海汇聚、更多创新成果在上海落地、更多青年人才在上海成长。
上海市经信委副主任潘焱在致辞中表示,当前人工智能正加快进入应用落地新阶段,产业竞争正在从“拼算法”向“拼数据”转变,高质量语料数据已成为人工智能发展的重要胜负手。近年来,上海持续实施“模塑申城”工程,在语料供给、平台建设和生态营造等方面取得显著成效。下一步,上海将围绕语料关键技术攻关、行业高价值流程语料建设和OPC等新业态培育持续发力,更好支撑模型训练、智能体开发和行业应用。
过去一年,模塑申城语料普惠计划持续为中小企业、高校师生、创新创业者提供低成本、高质量、可持续的语料服务。今年,该计划正式升级至2.0版本,延续“普惠、创新、链接”的总体要求,在原有基础上进一步增强应用导向。聚焦科学智能,提供“高真值、多模态、过程化”语料数据供给服务;面向OPC群体,提供更加轻量化、低成本的语料服务支撑。按照规划,到2027年底,计划将链接服务500个创新主体,打造300个稀缺数据集,面向社会普惠提供语料价值不少于1.5亿元,语料规模超过10PB。
2026 CICC语料数据智能创意大赛暨MinerU数据智能与前沿语料挑战赛启动。本届大赛聚焦语料数据智能创新与前沿应用探索,面向开发者搭建交流展示、同台竞技和成果转化的平台。
大赛围绕“语料支撑、场景牵引、应用落地、生态共建”的发展路径,设置三个赛道:MinerU数据智能与前沿语料挑战赛、场景开放与行业应用挑战赛、智能体开放主题黑客松挑战赛。大赛也将进一步面向社会寻找好场景、好应用、好技术、好团队。
国资国企拥有丰富的业务场景、数据资源和应用需求,是推动人工智能赋能实体经济的重要阵地。
2026国资国企AI+场景征集正式启动,进一步面向重点行业、重点企业、重点任务梳理形成一批可落地、可复制、可推广的AI+应用场景,推动真实业务需求加快转化为模型训练需求、智能体开发机会和产品落地空间。
帮助科研进步,让OPC开箱即用高质量语料
围绕科学智能发展需求,论坛举行共建高质量科学数据签约仪式。
当前,科学研究正加快从“文献驱动”迈向“数据驱动、模型驱动、实验验证驱动”深度融合的新阶段。此次签约将进一步把上海在科学智能领域的优势资源组织起来、联动起来,推动高质量科学数据的汇聚、治理、加工与应用,为AI4S发展夯实数据底座。
签约代表来自上海市研发公共服务平台管理中心、上海人工智能实验室、蛋白质科学研究(上海)设施、上海科学智能研究院、上海创智学院及相关科研机构和企业。
徐汇作为上海人工智能创新策源的重要载体,正加快打造更加便捷、高效、可获得的语料服务体系。当天发布的徐汇语料惠享专区,专为徐汇区AI企业打造,重点服务OPC创业者,提供开箱即用的AI-ready高质量语料。
专区推出“三重惠享”:一是经评估的OPC创业者最高可获50万元语料服务包,二是AI企业通过专区采购语料最高立减90%,三是提供30%语料券补贴,叠加市级政策后最高可获得60%资金扶持。同时,徐汇向经认定的高质量语料供给方提供年度最高500万元支持。
作为面向语料行业的重要年度遴选活动,语料风云榜已连续举办两年,一批好企业、好产品从中脱颖而出。今年,2026语料风云榜再次启航,将继续围绕“好企业、好产品、好规则”的基本框架,在未来三个月开展征集与遴选,并于2026世界人工智能大会期间正式发布“2026中国语料生产商风云榜TOP10”“2026中国语料服务商风云榜TOP10”。
此外,来自科研机构、创新平台、产业企业、投资机构和创业一线的专家,围绕科学数据建设、数据加工技术、行业场景落地、未来产业投资、OPC生态位重构、数据潜能释放以及具身智能发展趋势等议题展开深入交流。
论坛讨论既聚焦高质量语料数据如何更好支撑模型训练和智能体开发,也关注人工智能如何加快驶入城市交通等真实场景;既讨论“好数据”如何形成,也回应“好技术”如何突破、“好应用”如何涌现。
圆桌对话进一步把视角延伸到具身智能前沿,从技术成熟度、产业节奏、产品形态到生态机会,围绕“具身智能的ChatGPT时刻:渐近,还是已至?”展开交流,呈现出从语料底座、技术能力到行业应用、产业生态的完整链条。
分享让更多人看到
- 评论
- 关注
































第一时间为您推送权威资讯
报道全球 传播中国
关注人民网,传播正能量