首頁
黨政
- 黨網 · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
觀點
互動
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陝
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網站
人工智能
人民網客戶端
網站無障礙
舉報
登錄

退出

人民網>>上海頻道>>要聞

升至2.0版，2025金融大模型評測體系在上海發布

2025年12月29日08:59 |

小字號

金融大模型評測體系2.0版發布

近日，2025金融大模型評測體系在上海發布，這是去年全國首個金融大模型評測體系發布以來第一次全面升級至2.0版，主要聚焦標准引領、數據驅動、安全可信與生態共建四方面。

大模型評測體系通常是評估大模型的性能、安全性、可靠性等方面的指標、方法、基准和流程的集合。近年來，國內涌現出多個金融大模型，但行業內還缺少較為權威和被認可的評測體系。而2025金融大模型評測體系，相當於為行業提供了科學選型和與能力對標的重要“標尺”。

據介紹，該評測體系匯聚了4個公開數據集與22個自建數據集，約3.6萬條評測數據，採用循環選項打亂機制和多樣化提示詞，並研發金融裁判大模型，實現評測全流程自動化、標准化，為上海金融領域銀行、券商、基金、投資等企業或者機構人員提供權威、精准的大模型能力評估，助力機構選型、優化及風險把控。

在最新的評測體系下，今年的金融大模型測試結果全面超越去年，行業平均71.9分提升到87.37分。同時，測試結果還發現，海內外大模型整體能力相差不大，但在中文領域，國內大模型處於領先水平。另外，國內金融大模型在語言理解、術語消歧、法規政策更新和合規對齊等領域領先，國外金融大模型則在數學計算、跨步推理、跨語言推理和超長文本處理上領先。

（來源：解放日報記者查睿）

(責編：嚴遠、軒召強)

分享讓更多人看到

客戶端下載

熱門排行

人民日報社概況 | 關於人民網 | 報社招聘 | 招聘英才 | 廣告服務 | 合作加盟 | 供稿服務 | 數據服務 | 網站聲明 | 網站律師 | 信息保護 | 聯系我們

人民日報違法和不良信息舉報電話：010-65363263 舉報郵箱：jubao@people.cn

人民網服務郵箱：kf@people.cn 違法和不良信息舉報電話：010-65363636 舉報郵箱：rmwjubao@people.cn

互聯網新聞信息服務許可証10120170001 | 增值電信業務經營許可証B1-20060139 | 廣播電視節目制作經營許可証（廣媒）字第172號

信息網絡傳播視聽節目許可証0104065 | 網絡文化經營許可証京網文[2020]5494-1075號 | 網絡出版服務許可証（京）字121號 | 京ICP証000006號 | 京公網安備11000002000008號

人民網股份有限公司版權所有，未經書面授權禁止使用
Copyright © 1997-2025 by www.people.com.cn. all rights reserved

評論
分享
關注
微信微博快手
第一時間為您推送權威資訊

報道全球傳播中國

關注人民網，傳播正能量

返回頂部