人民網
人民網>>上海頻道>>要聞

大江東︱誰將“生成未來”?聽業界大咖展望人工智能新趨勢

人民日報中央廚房-大江東工作室謝衛群 黃曉慧 沈文敏
2023年07月10日08:59 |
小字號

大模型將引領新一輪的科技革命還是一陣風的投資泡沫?大模型訓練需要海量數據和強勁算力支撐,擁有優質的數據資源就勝券在握了嗎?作為人工智能領域的行業盛會,每年的世界人工智能大會都是觀察產業方向的觀測台和找准行業航標的瞭望塔,今年亦是如此。

2023世界人工智能大會以“智聯世界 生成未來”為主題。把“生成”寫入主題,呼應了當前人工智能領域的一大熱點。無論世博展覽館5萬平方米主展覽區內超400家企業展示的硬核炫技,還是1400多名業界大咖、頂尖大腦雲集的上百場論壇活動,嘉賓觀眾、場內場外,三句話不離“大模型”,大模型與生成式人工智能(AIGC)無疑是本屆世界人工智能大會當仁不讓的絕對主角。

且聽海內外專家學者、領軍企業如何展望人工智能新趨勢。

“群模大戰”誰主沉浮?人類原創思想無可取代,核心技術競爭將更激烈

上海世博中心,2023世界人工智能大會現場人頭攢動

自2022年11月ChatGPT引爆“生成式人工智能熱”以來,能夠根據提示生成文本、圖像或其他信息的人工智能系統,就成為國內各大科技公司競逐的新賽道,不少科技公司都公布了自己的大模型。5月底,科技部新一代人工智能發展研究中心等機構發布的《中國人工智能大模型地圖研究報告》顯示,當前國內10億參數規模以上的大模型已發布79個。僅從大模型數量上看,中國有“群模大戰”之勢,但尚未出現現象級的“突圍”大模型。

2023世界人工智能大會啟明創投論壇發布的報告《生成式AI》認為,生成式人工智能,在中國似乎受到了更加熱情的接納:政府鼓勵發展通用人工智能﹔任何一家大企業都無法不關注它﹔許多從事知識工作的中小企業,已經先用起來再說。面對這一革命性的技術,許多企業都被卷入。它們節奏不同,介入程度不同,成為新技術浪潮下的守成者、創新者、採納者。

有專家認為,中國經濟對高質量發展的需求,從過去資源驅動發展升級到數智創新驅動的應用,都在推動數智技術廣泛落地應用,顛覆性AI產品的相繼出現,使得從基礎軟硬件架構、核心算法到應用場景等領域的核心技術競爭將更加激烈。

在大會產業發展論壇上,由中國科學技術信息研究所發布的《2022全球人工智能創新指數報告》顯示,中國在網絡基礎、人才、教育、創新制度、專利等方面排名上升,其中科學和工程博士佔比、人工智能專利授權量、AI上市企業數量等多個指標進步顯著,躍升榜首。但同時,數據和網絡基礎指標表現較弱,公共數據質量和開放度不高,網絡基礎多個指標仍處於參評國家的中等偏下水平。

南洋理工大學計算機科學與工程學院助理教授潘新鋼在科學前沿論壇上表示,大模型擅長模仿人的推理,可以替代人的機械勞動、推理任務,但還達不到人類從0到1的創新能力,大模型的出現更加彰顯人類原始創新能力的不可替代性和重要性。

大模型參數規模持續倍增,優質數據、澎湃算力更為重要

上海世博展覽館,觀眾觀看機器人群舞表演

一個優秀的大模型需要大量優質數據和優質反饋。ChatGPT的出現和大模型的涌現,在很多人看來是石破天驚之舉,但在微軟全球資深副總裁侯陽看來,這是全世界無數優秀科研人員日復一日的研究基礎以及海量計算資源的投入,才造就的創新成果。

侯陽表示,從2019年開始,微軟就跟OpenAI展開深度合作,以海量的雲計算資源,支持OpenAI大語言模型的研究,也正是微軟智能雲提供的基礎架構和算力支持,才有了OpenAI ChatGPT的突破。

隨著生成式人工智能走向通用人工智能(AGI)時代,優質數據“投喂”與“訓練”在呈指數級增長。“ChatGPT-3計算量約有幾千億個數據點,單次訓練耗電量1287兆瓦時,從能耗來說相當於開車往返地球到月球一次,約花費500萬-1000萬美元。ChatGPT-1的訓練隻有1.7億個數據點,到了ChatGPT-4超過1萬億個數據點,生成式人工智能對算力的需求是指數級的增長。”在大會人工智能應用創新論壇上,哈工大人工智能研究院院長劉劼教授以ChatGPT的迭代“進化”為例,說明生成“生成式人工智能”所消耗之巨大——大模型研發依然是一件很“燒錢”的事。

在“雙碳”的時代背景下,模型在算力層面對能源和環境的影響尤為值得關注。在大會主論壇科學前沿全體會議上,圖靈獎得主大衛·帕特森也表達了近似的觀點:當前訓練某一模型需要產生大量碳排放,如果進一步提升模型准確度,排放數字可能會更大。而在未來,研究人員有望從模型、硬件、數據中心能效、數據中心位置等四方面協同著手,大幅降低機器學習的能耗與碳排放。

高質量的數據對大模型訓練至關重要,不僅會提升訓練的效率,還能降低能耗,劉劼提醒說,“盡管各個大模型用的訓練數據不盡相同,但大多數都把高質量、成熟的文獻作為訓練的基礎,訓練數據大多採用從網站上、標准對話數據集收集而來的新聞、科學文獻、代碼,基本上不會採用社交網絡上的信息。”

賦能千行百業,人工智能應用落地將更快更高效

工作人員展示使用動捕設備驅動虛擬人

ChatGPT的橫空出世,讓人們對生成式人工智能、具身智能等賦能千行百業、延伸人間百態,抱著無盡的期許。誠然,AI吟詩作畫、下棋陪聊、看病抓藥早已不是什麼吸引眼球的新鮮技能,如華為輪值董事長胡厚崑在大會開幕式上所言,人工智能的發展,關鍵要“走深向實”,賦能產業升級,服務好千行百業、服務好科學研究。

NewOrigin大模型的研發領軍人、清華大學智能產業研究院卓越訪問教授、分子之心創始人許錦波教授表示,AI蛋白質生成大模型瞄准創新藥設計、合成生物學等真實產業應用需求,將用一個模型滿足蛋白質生成全流程需求,未來大分子藥、新生物材料等蛋白質設計可實現“一鍵定制”。

據介紹,NewOrigin大模型通過學習千億級多模態大數據,可實現多模態定向生成,單模型就能滿足序列生成、結構預測、功能預測、從頭設計等蛋白質生成全流程需求,解決產業應用所需的特定功能蛋白質生成難題,並在真實的產業環境中評估效果與價值。

騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生認為,大模型正推動AI在產業中的應用進入“深水區”,“AI可以成為我們的智能助手,比如客服助手、代碼助手、工業質檢助手等,在質量與效率都可以做到更好。”

在世博展覽館,國網智能電網研究院發布了電力設備知識計算及服務引擎等三項新成果。如何在大模型時代讓全世界規模最龐大的電力系統變得更加聰明、綠色,是國網智能電網研究院計算及應用研究所所長周飛一直思考的問題。“我國電力系統是世界上規模最大、結構最復雜、能源轉型最快的人造巨系統,在電力平衡、系統調控、設備運維、人員作業等方面存在諸多挑戰,需借助先進人工智能技術提升狀態感知、運行認知、控制決策的智能化水平。”他認為,數字化和能源科技革命兩股浪潮的疊加帶來新的機遇,能源行業與大模型公司合作,“量身”訓練能源領域的大模型,將為數實融合尋找可行的新路徑。

有關專家指出,基於大模型的應用程序編程接口服務(API),會為下游廣泛的行業應用和創新生態提供數智化能力。隨著AI技術的迭代發展,開源大模型和生成式人工智能社區的建設,AI落地效率將進一步提升。具備通用領域能力的大模型將顯著降低針對特定領域進行定制化開發的成本,提高AI算法的應用效果。各行業應用AI技術的門檻將大幅降低,廣大AI從業者甚至技術“小白”們都可以便捷使用最新的AI技術,解決生活中、工作上遇到的問題。

湯道生認為,AI產業應用將邁向“寬場景”,開放共建、合作共贏是實現AI大規模產業落地的關鍵。未來,隨著很多企業逐步邁向智能化,AI的應用從老百姓的吃喝玩樂、衣食住行,到企業工廠的生產、銷售、服務、辦公都會覆蓋,場景足夠寬廣。“不會有一家公司能夠包攬全部工作,AI生態特別需要合作開放。同時,AI也是一個‘長期賽道’,不是短暫的風口,耐心和信心一樣重要。”湯道生強調。

AI會被“教唆使壞”?治理和規范需要AI生態更加開放多元

7月6日,在2023世界人工智能大會上,美國國家工程院外籍院士沈向洋、電氣與電子工程師協會主席兼首席執行官賽義夫·拉曼進行對話

大模型的誤導、以假亂真、指鹿為馬,虛假信息的傳播,信息裸奔導致隱私泄露......甚至有專家擔心AI會被教唆使壞,如果“投喂”給大模型的數據有問題,大模型很快會被教壞了,因為它自身並沒有像人類一樣的價值判斷體系和法律監管體系。

今年4月,國家網信辦正式發布《生成式人工智能服務管理辦法(征求意見稿)》,這是我國首次針對生成式AI產業發布的規范性政策。

“現在看到的生成式換臉、聲音合成很逼真,這些生成的內容如果有知識產權,到底歸誰?是提供模型的人還是提問的人,或是最早提供數據的人?這很難界定。”劉劼認為,針對大模型面臨道德倫理、欺騙性、知識產權等可信危機,需要打造具備安全性和魯棒性、可解釋性、問責和可審計、環境保護、隱私保護、非歧視和公平性等的可靠、可信、可解釋的AI。

湯道生認為,數據是大模型的原材料,模型最終要在真實場景落地,達到理想的服務效果,往往需要把企業自身的數據也用起來。在這一過程中,如果數據保護不當,可能造成企業核心數據、敏感數據的泄漏。行業大模型和模型開發工具可以通過私有化部署等方式,讓模型訓練更放心,也可以避免員工訪問模型時,發生企業敏感數據的外泄。

自參與業界聯名呼吁暫停訓練大型AI模型后,特斯拉CEO埃隆·馬斯克在大會開幕式上,再次表達自己對深度而全面的人工智能的擔憂。他說,“這樣的超級智能有強大的能力,比人類要強大,這是一種風險和擔憂。它可能會有很積極的未來,但也有概率出現一些負面的未來。現在需要有一些監管,對它們進行監督,我們要盡可能確保這些消極的未來不發生,積極的未來會發生。”

對於如何實現AI的治理和規范,圖靈獎得主、被譽為“深度學習三劍客”之一的Meta AI基礎人工智能研究團隊首席人工智能科學家楊立昆認為,可以通過可控的方法、設置安全護欄等使它們不會出現欺騙和支配人類的行為。

但是,楊立昆並不贊同“任何人可用人工智能做任何事,情況可能會非常危險,所以需要嚴格監管人工智能”這一說法。他認為,嚴格監管人工智能發展並不能保証AI安全,從長遠看,開源才能讓AI保持安全、良善。“想象一下,未來10年或15年后,我們每個人都通過人工智能助手與數字世界互動,如果技術被少數公司控制,這不是好事。未來的人工智能系統應該成為人類所有知識的寶庫,它們的訓練方式必須基於眾多的源頭,我希望看到更多的開源AI系統。”

侯陽表示,要打造負責任的AI,需要遵循六大原則,也就是公平、可靠、安全、透明、隱私以及包容,“我們倡導全球科技企業通過合作,形成共識,確保AI技術造福全人類。”

(本文圖片均為王初攝)

(責編:嚴遠、軒召強)

分享讓更多人看到

返回頂部