首个语料库建设导则面世!近二十家企业共同发布
2024年07月06日17:30 | 来源:人民网-上海频道
小字号
人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。
本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。
《语料库建设导则》发布。人民网记者 王初摄
为实现“语料数据资源共建共享”“鼓励多元主体共同推动高水平语料数据要素建设”的目标,上海库帕思科技有限公司会同覆盖多模态数据资源供应、加工、应用和运营全链的近二十家企业共同发布了团体标准《语料库建设导则》。
本次论坛中还发布了金融、生命健康、教育三项行业语料技术白皮书。
三大领域语料技术白皮书发布。人民网记者 王初摄
《高质量金融语料技术白皮书》聚焦银行、证券、保险、基金等行业实践,重新定义了高质量金融语料数据集的内涵和外延,形成了基于金融领域知识体系的“语料魔方”方法论。
《教育人工智能大模型数据治理与共享技术白皮书》对标国内外教育数据的系列政策、标准,确立了教育行业语料数据的标准用例与价值体系,形成了一套教育AI大模型数据治理与共享技术标准。
《高质量生命健康语料技术白皮书》从基础医学、药物研发、临床医学、健康管理、中医中药五个方向确立了生命健康语料库的路线图,创新了从寻源、清洗到标注、测试的工具体系。
(责编:唐小丽、轩召强)
分享让更多人看到
- 评论
- 关注