人民網
人民網>>上海頻道>>要聞

升至2.0版,2025金融大模型評測體系在上海發布

2025年12月29日08:59 |
小字號

金融大模型評測體系2.0版發布

近日,2025金融大模型評測體系在上海發布,這是去年全國首個金融大模型評測體系發布以來第一次全面升級至2.0版,主要聚焦標准引領、數據驅動、安全可信與生態共建四方面。

大模型評測體系通常是評估大模型的性能、安全性、可靠性等方面的指標、方法、基准和流程的集合。近年來,國內涌現出多個金融大模型,但行業內還缺少較為權威和被認可的評測體系。而2025金融大模型評測體系,相當於為行業提供了科學選型和與能力對標的重要“標尺”。

據介紹,該評測體系匯聚了4個公開數據集與22個自建數據集,約3.6萬條評測數據,採用循環選項打亂機制和多樣化提示詞,並研發金融裁判大模型,實現評測全流程自動化、標准化,為上海金融領域銀行、券商、基金、投資等企業或者機構人員提供權威、精准的大模型能力評估,助力機構選型、優化及風險把控。

在最新的評測體系下,今年的金融大模型測試結果全面超越去年,行業平均71.9分提升到87.37分。同時,測試結果還發現,海內外大模型整體能力相差不大,但在中文領域,國內大模型處於領先水平。另外,國內金融大模型在語言理解、術語消歧、法規政策更新和合規對齊等領域領先,國外金融大模型則在數學計算、跨步推理、跨語言推理和超長文本處理上領先。

(來源:解放日報 記者 查睿)

(責編:嚴遠、軒召強)

分享讓更多人看到

返回頂部