人民網
人民網>>上海頻道

首個語料庫建設導則面世!近二十家企業共同發布

2024年07月06日17:30 | 來源:人民網-上海頻道
小字號

人民網上海7月6日電 (記者唐小麗)高質量、大規模、安全可信的語料數據資源是AI時代的重要基石。7月6日上午,2024世界人工智能大會語料主題論壇在上海世博中心舉辦。

本次論壇以“語料筑基,智生時代”為主題,圍繞高質量語料數據如何高效供給賦能大模型產業發展,向市場傳遞專業化、鏈接型、前瞻性的語料生態設計理念。

《語料庫建設導則》發布。人民網記者 王初攝

為實現“語料數據資源共建共享”“鼓勵多元主體共同推動高水平語料數據要素建設”的目標,上海庫帕思科技有限公司會同覆蓋多模態數據資源供應、加工、應用和運營全鏈的近二十家企業共同發布了團體標准《語料庫建設導則》。

本次論壇中還發布了金融、生命健康、教育三項行業語料技術白皮書。

三大領域語料技術白皮書發布。人民網記者 王初攝

《高質量金融語料技術白皮書》聚焦銀行、証券、保險、基金等行業實踐,重新定義了高質量金融語料數據集的內涵和外延,形成了基於金融領域知識體系的“語料魔方”方法論。

《教育人工智能大模型數據治理與共享技術白皮書》對標國內外教育數據的系列政策、標准,確立了教育行業語料數據的標准用例與價值體系,形成了一套教育AI大模型數據治理與共享技術標准。

《高質量生命健康語料技術白皮書》從基礎醫學、藥物研發、臨床醫學、健康管理、中醫中藥五個方向確立了生命健康語料庫的路線圖,創新了從尋源、清洗到標注、測試的工具體系。

(責編:唐小麗、軒召強)

分享讓更多人看到

返回頂部