人民网
人民网>>上海频道>>要闻

大江东|谁将“生成未来”?听业界大咖展望人工智能新趋势

人民日报中央厨房-大江东工作室谢卫群 黄晓慧 沈文敏
2023年07月10日08:59 |
小字号

大模型将引领新一轮的科技革命还是一阵风的投资泡沫?大模型训练需要海量数据和强劲算力支撑,拥有优质的数据资源就胜券在握了吗?作为人工智能领域的行业盛会,每年的世界人工智能大会都是观察产业方向的观测台和找准行业航标的瞭望塔,今年亦是如此。

2023世界人工智能大会以“智联世界 生成未来”为主题。把“生成”写入主题,呼应了当前人工智能领域的一大热点。无论世博展览馆5万平方米主展览区内超400家企业展示的硬核炫技,还是1400多名业界大咖、顶尖大脑云集的上百场论坛活动,嘉宾观众、场内场外,三句话不离“大模型”,大模型与生成式人工智能(AIGC)无疑是本届世界人工智能大会当仁不让的绝对主角。

且听海内外专家学者、领军企业如何展望人工智能新趋势。

“群模大战”谁主沉浮?人类原创思想无可取代,核心技术竞争将更激烈

上海世博中心,2023世界人工智能大会现场人头攒动

自2022年11月ChatGPT引爆“生成式人工智能热”以来,能够根据提示生成文本、图像或其他信息的人工智能系统,就成为国内各大科技公司竞逐的新赛道,不少科技公司都公布了自己的大模型。5月底,科技部新一代人工智能发展研究中心等机构发布的《中国人工智能大模型地图研究报告》显示,当前国内10亿参数规模以上的大模型已发布79个。仅从大模型数量上看,中国有“群模大战”之势,但尚未出现现象级的“突围”大模型。

2023世界人工智能大会启明创投论坛发布的报告《生成式AI》认为,生成式人工智能,在中国似乎受到了更加热情的接纳:政府鼓励发展通用人工智能;任何一家大企业都无法不关注它;许多从事知识工作的中小企业,已经先用起来再说。面对这一革命性的技术,许多企业都被卷入。它们节奏不同,介入程度不同,成为新技术浪潮下的守成者、创新者、采纳者。

有专家认为,中国经济对高质量发展的需求,从过去资源驱动发展升级到数智创新驱动的应用,都在推动数智技术广泛落地应用,颠覆性AI产品的相继出现,使得从基础软硬件架构、核心算法到应用场景等领域的核心技术竞争将更加激烈。

在大会产业发展论坛上,由中国科学技术信息研究所发布的《2022全球人工智能创新指数报告》显示,中国在网络基础、人才、教育、创新制度、专利等方面排名上升,其中科学和工程博士占比、人工智能专利授权量、AI上市企业数量等多个指标进步显著,跃升榜首。但同时,数据和网络基础指标表现较弱,公共数据质量和开放度不高,网络基础多个指标仍处于参评国家的中等偏下水平。

南洋理工大学计算机科学与工程学院助理教授潘新钢在科学前沿论坛上表示,大模型擅长模仿人的推理,可以替代人的机械劳动、推理任务,但还达不到人类从0到1的创新能力,大模型的出现更加彰显人类原始创新能力的不可替代性和重要性。

大模型参数规模持续倍增,优质数据、澎湃算力更为重要

上海世博展览馆,观众观看机器人群舞表演

一个优秀的大模型需要大量优质数据和优质反馈。ChatGPT的出现和大模型的涌现,在很多人看来是石破天惊之举,但在微软全球资深副总裁侯阳看来,这是全世界无数优秀科研人员日复一日的研究基础以及海量计算资源的投入,才造就的创新成果。

侯阳表示,从2019年开始,微软就跟OpenAI展开深度合作,以海量的云计算资源,支持OpenAI大语言模型的研究,也正是微软智能云提供的基础架构和算力支持,才有了OpenAI ChatGPT的突破。

随着生成式人工智能走向通用人工智能(AGI)时代,优质数据“投喂”与“训练”在呈指数级增长。“ChatGPT-3计算量约有几千亿个数据点,单次训练耗电量1287兆瓦时,从能耗来说相当于开车往返地球到月球一次,约花费500万-1000万美元。ChatGPT-1的训练只有1.7亿个数据点,到了ChatGPT-4超过1万亿个数据点,生成式人工智能对算力的需求是指数级的增长。”在大会人工智能应用创新论坛上,哈工大人工智能研究院院长刘劼教授以ChatGPT的迭代“进化”为例,说明生成“生成式人工智能”所消耗之巨大——大模型研发依然是一件很“烧钱”的事。

在“双碳”的时代背景下,模型在算力层面对能源和环境的影响尤为值得关注。在大会主论坛科学前沿全体会议上,图灵奖得主大卫·帕特森也表达了近似的观点:当前训练某一模型需要产生大量碳排放,如果进一步提升模型准确度,排放数字可能会更大。而在未来,研究人员有望从模型、硬件、数据中心能效、数据中心位置等四方面协同着手,大幅降低机器学习的能耗与碳排放。

高质量的数据对大模型训练至关重要,不仅会提升训练的效率,还能降低能耗,刘劼提醒说,“尽管各个大模型用的训练数据不尽相同,但大多数都把高质量、成熟的文献作为训练的基础,训练数据大多采用从网站上、标准对话数据集收集而来的新闻、科学文献、代码,基本上不会采用社交网络上的信息。”

赋能千行百业,人工智能应用落地将更快更高效

工作人员展示使用动捕设备驱动虚拟人

ChatGPT的横空出世,让人们对生成式人工智能、具身智能等赋能千行百业、延伸人间百态,抱着无尽的期许。诚然,AI吟诗作画、下棋陪聊、看病抓药早已不是什么吸引眼球的新鲜技能,如华为轮值董事长胡厚崑在大会开幕式上所言,人工智能的发展,关键要“走深向实”,赋能产业升级,服务好千行百业、服务好科学研究。

NewOrigin大模型的研发领军人、清华大学智能产业研究院卓越访问教授、分子之心创始人许锦波教授表示,AI蛋白质生成大模型瞄准创新药设计、合成生物学等真实产业应用需求,将用一个模型满足蛋白质生成全流程需求,未来大分子药、新生物材料等蛋白质设计可实现“一键定制”。

据介绍,NewOrigin大模型通过学习千亿级多模态大数据,可实现多模态定向生成,单模型就能满足序列生成、结构预测、功能预测、从头设计等蛋白质生成全流程需求,解决产业应用所需的特定功能蛋白质生成难题,并在真实的产业环境中评估效果与价值。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生认为,大模型正推动AI在产业中的应用进入“深水区”,“AI可以成为我们的智能助手,比如客服助手、代码助手、工业质检助手等,在质量与效率都可以做到更好。”

在世博展览馆,国网智能电网研究院发布了电力设备知识计算及服务引擎等三项新成果。如何在大模型时代让全世界规模最庞大的电力系统变得更加聪明、绿色,是国网智能电网研究院计算及应用研究所所长周飞一直思考的问题。“我国电力系统是世界上规模最大、结构最复杂、能源转型最快的人造巨系统,在电力平衡、系统调控、设备运维、人员作业等方面存在诸多挑战,需借助先进人工智能技术提升状态感知、运行认知、控制决策的智能化水平。”他认为,数字化和能源科技革命两股浪潮的叠加带来新的机遇,能源行业与大模型公司合作,“量身”训练能源领域的大模型,将为数实融合寻找可行的新路径。

有关专家指出,基于大模型的应用程序编程接口服务(API),会为下游广泛的行业应用和创新生态提供数智化能力。随着AI技术的迭代发展,开源大模型和生成式人工智能社区的建设,AI落地效率将进一步提升。具备通用领域能力的大模型将显著降低针对特定领域进行定制化开发的成本,提高AI算法的应用效果。各行业应用AI技术的门槛将大幅降低,广大AI从业者甚至技术“小白”们都可以便捷使用最新的AI技术,解决生活中、工作上遇到的问题。

汤道生认为,AI产业应用将迈向“宽场景”,开放共建、合作共赢是实现AI大规模产业落地的关键。未来,随着很多企业逐步迈向智能化,AI的应用从老百姓的吃喝玩乐、衣食住行,到企业工厂的生产、销售、服务、办公都会覆盖,场景足够宽广。“不会有一家公司能够包揽全部工作,AI生态特别需要合作开放。同时,AI也是一个‘长期赛道’,不是短暂的风口,耐心和信心一样重要。”汤道生强调。

AI会被“教唆使坏”?治理和规范需要AI生态更加开放多元

7月6日,在2023世界人工智能大会上,美国国家工程院外籍院士沈向洋、电气与电子工程师协会主席兼首席执行官赛义夫·拉曼进行对话

大模型的误导、以假乱真、指鹿为马,虚假信息的传播,信息裸奔导致隐私泄露......甚至有专家担心AI会被教唆使坏,如果“投喂”给大模型的数据有问题,大模型很快会被教坏了,因为它自身并没有像人类一样的价值判断体系和法律监管体系。

今年4月,国家网信办正式发布《生成式人工智能服务管理办法(征求意见稿)》,这是我国首次针对生成式AI产业发布的规范性政策。

“现在看到的生成式换脸、声音合成很逼真,这些生成的内容如果有知识产权,到底归谁?是提供模型的人还是提问的人,或是最早提供数据的人?这很难界定。”刘劼认为,针对大模型面临道德伦理、欺骗性、知识产权等可信危机,需要打造具备安全性和鲁棒性、可解释性、问责和可审计、环境保护、隐私保护、非歧视和公平性等的可靠、可信、可解释的AI。

汤道生认为,数据是大模型的原材料,模型最终要在真实场景落地,达到理想的服务效果,往往需要把企业自身的数据也用起来。在这一过程中,如果数据保护不当,可能造成企业核心数据、敏感数据的泄漏。行业大模型和模型开发工具可以通过私有化部署等方式,让模型训练更放心,也可以避免员工访问模型时,发生企业敏感数据的外泄。

自参与业界联名呼吁暂停训练大型AI模型后,特斯拉CEO埃隆·马斯克在大会开幕式上,再次表达自己对深度而全面的人工智能的担忧。他说,“这样的超级智能有强大的能力,比人类要强大,这是一种风险和担忧。它可能会有很积极的未来,但也有概率出现一些负面的未来。现在需要有一些监管,对它们进行监督,我们要尽可能确保这些消极的未来不发生,积极的未来会发生。”

对于如何实现AI的治理和规范,图灵奖得主、被誉为“深度学习三剑客”之一的Meta AI基础人工智能研究团队首席人工智能科学家杨立昆认为,可以通过可控的方法、设置安全护栏等使它们不会出现欺骗和支配人类的行为。

但是,杨立昆并不赞同“任何人可用人工智能做任何事,情况可能会非常危险,所以需要严格监管人工智能”这一说法。他认为,严格监管人工智能发展并不能保证AI安全,从长远看,开源才能让AI保持安全、良善。“想象一下,未来10年或15年后,我们每个人都通过人工智能助手与数字世界互动,如果技术被少数公司控制,这不是好事。未来的人工智能系统应该成为人类所有知识的宝库,它们的训练方式必须基于众多的源头,我希望看到更多的开源AI系统。”

侯阳表示,要打造负责任的AI,需要遵循六大原则,也就是公平、可靠、安全、透明、隐私以及包容,“我们倡导全球科技企业通过合作,形成共识,确保AI技术造福全人类。”

(本文图片均为王初摄)

(责编:严远、轩召强)

分享让更多人看到

返回顶部