懂企业,和企业一起走通一条路

DeepSeek横空出世后,热度一直不减,令AI大模型企业振奋,也令国人兴奋和自豪。
网友并非只追互联网热梗,很快总结出DeepSeek诞生的背后有一支“闷声干大事”的团队,以及一个“无事不扰、有求必应”且足够有耐心的政府。
上海是否有类似的故事?最有发言权的是上海本土的AI大模型企业。大家给出的真实反馈是,上海以人工智能产业的发展能级和这座城市骨子里的实干精神,正在书写着自己的故事。
在浦东、徐汇、杨浦以及临港新片区等上海人工智能产业发展的重点区域,企业聚焦芯片、大模型、人形机器人等前沿技术,正在创造属于自己的“核爆点”。
算力和语料还重要吗
“每年春节都有惊喜,去年是OpenAI的文生视频大模型Sora,今年就是我们中国自己的推理大模型DeepSeek-R1。”在位于徐汇西岸的中国首个大模型创新生态社区“模速空间”,DeepSeek不仅是热议的谈资,更是会实打实接入各家企业自研大模型的重要帮手。
自2023年9月揭牌以来,模速空间仅用38个昼夜,就实现一期近1万平方米空间从毛坯到让企业拎包入住。截至2024年底,这里已有255家大模型企业、34个备案大模型、100余家投资机构成功落地,未来将建成10万平方米的产业空间。
首批入驻模速空间的秘塔科技是一家AI搜索大模型研发企业。除夕夜,他们就接入了“满血版”的DeepSeek-R1。公司首席运营官王益为说,DeepSeek擅长的深度思考能力可在秘塔既有的AI搜索基础上,对不同的可信数据源之间进行比较推理并提出观点,颇具启发性,能帮助开发者更好地优化其自研大模型。
记者采访模速空间多家AI大模型企业时发现,大模型开发者之间虽有竞争或理念差异,但对整个行业里程碑式的跨越都有一种惺惺相惜的感触。大模型开发与其他许多科创行业一样,都需要一颗赤子之心,一股“板凳须坐十年冷”的坚持。
再看过去半个月里“老生常谈”的问题:DeepSeek用强大的算法打破了“唯算力论”的限制,算力和语料还重要吗?都说上海发展大模型的优势在于应用场景,基础模型的发展水平又如何?
模速空间内,来自大模型应用层的企业认为,应用端始终是上海的强大优势,但Minimax、阶跃星辰等上海基模企业的开发能力同样强大。“对于真正想做好大模型、想干事的人来说,他人的成功一定是激励,而非震慑。”一位大模型从业者总结。
“算力重不重要”的答案更显而易见。一位开发者举例:如果用600亿—700亿规模的参数来更新一个模型,几百张卡的算力需要一个月后才能得出实验结果。如果使用万卡级别的算力,2天就能完成。“同样的时间,别人训练一次模型用时3小时,而你花了3天,那么别人就能得出更多结果、试验更多变化。”
为此,徐汇区正依托模速空间,打造具备九大算力合作伙伴、超5万张卡的算力调度平台,全区规划30EFLOPS算力资源,在区级层面充分托举大模型企业。
实打实的算力补贴
在模速空间A区的公共休闲区,记者与一位刚来此一年多的海归大模型创业者聊天时,对方连说了两次“上海是中国最重视AI的城市”。
对企业来说,“重视”最直接体现在真金白银上。以模速空间为例,除了租金支持和来自徐汇资本、临港集团的投资外,还有一项对所有大中小企业来说都称得上“惊艳”的服务:实打实的算力补贴。
“创业6年,搬来模速空间后,我才第一次真真正正拿到了算力补贴。”模速空间一位大模型企业的联合创始人向记者感叹。此前,他带领团队在其他地方参加过几次大模型比赛,试图拓宽获取算力的渠道。“最后大家都拿着‘大支票’一起照相了,结果允诺的补贴没有了下文。”
为何光“履行算力补贴承诺”一项服务,就足以让企业拍手称赞?给企业省钱是一方面,大模型还是一个与时间赛跑的产业,获取算力越便利,意味着训练模型时跑完一次模型的用时越短。这直接关系到模型优化与迭代的效率,更决定着能否抢占市场先机。
“有算力补贴是真给”的不只有模速空间一家。在位于浦东张江的大模型产业生态集聚区“模力社区”,人工智能领域的高端人才团队最高可获得700万元的个人及团队赞助以及最高1亿元的项目补贴。
有网友讨论何谓“最懂科技企业的政府”。在上海AI大模型企业眼中,知道企业缺什么,且能随时为企业补位、补链的政府,何尝不是“最懂企业”。
不少大模型企业希望,接下来上海能从区级层面开始,加大真实场景和数据的开放。还有一项当务之急:为传统企业实现数字化赋能。“上海企业多、企业质量好,在借助大模型工具加快数字化转型方面大有可为。”
把一条路走到极致
企业越发多样且专业化的诉求,倒逼政府职能部门的干部们不断学习,加强专业服务能力。
记者采访过不少科创企业、AI企业,只要提前做足功课,提的问题专业,企业其实很乐意与记者聊关于数字人、大模型,以及更加精深的专业领域话题,从成本投入到业绩分析都愿意分享。
科创企业对于媒体采访是这样,对于区、街道招商服务人员上门服务、政府部门举办座谈会等,也是如此。“你懂我,我们才能在一个频道交流互动;当我有需要的时候,才可能得到实实在在的帮助”。
对于DeepSeek的成功,有位大模型开发者的话令记者印象深刻。“通过极致的软硬件性能优化与适配,把这样一条一开始并非所有人都看好的路走通了。”
把一条路走到极致,常常要经历漫长的时间。其间会有不少企业因资金链断裂或丧失信心而中途放弃。是帮助更多企业坚持到黎明之后,还是尊重市场自然的优胜劣汰规律?这既考验政府把握“为与不为”的尺度,更考验其对产业的战略眼光。
但眼前已有不少好建议。有融资已经超过10亿元的大模型企业建议,类似模速空间这样的平台要更紧密关注初创阶段资源少、资金紧的团队,保持大模型产业的生态梯度。
还有企业提出,希望上海进一步优化大模型企业的容缺容错机制,尤其针对大模型的“知识幻觉”所造成的信息偏差、用户投诉,能给予企业一定的容错机会并让其及时纠正。
“大家都在为这个行业好”,在上海大模型领域,在各区相关产业区域,这早已是共识和行为准则。(记者 舒抒)
分享让更多人看到
- 评论
- 关注