雲知聲:自然語言處理算法在醫療領域率先應用

2020年04月14日22:22  來源:人民網-上海頻道
 

近日,記者獲悉,自然語言處理領域國際頂級會議 ACL 2020 (Association for Computational Linguistics)論文接收結果公布。雲知聲-中科院自動化所“語言與知識計算聯合實驗室”共有3篇論文被收錄,分別在醫療對話的自動信息抽取、國際疾病分類(ICD)自動編碼,以及 ICD 自動編碼可解釋性等領域取得突破。

雲知聲表示,這些最新的自然語言處理算法將為后續研究提供有價值的經驗和方向。目前,已在雲知聲醫療業務率先應用。

雲知聲介紹,如今,電子病歷已經成為現代醫療的重要組成部分,但是目前書寫電子病歷費時費力,已經成為醫生的沉重負擔。通過面向醫患對話文本的信息抽取系統,可從對話中抽取出症狀、檢查、手術、一般信息及其相應的狀態。這些抽取出的信息將有助於醫生書寫病歷,或者更進一步地應用於病歷的自動生成。

在臨床醫學決策方面,雲知聲表示,為了緩解人工編碼耗時、費力、容易出錯的問題,很多工作開始研究利用機器進行自動的 ICD 編碼。研究團隊通過結合中文的語言特點,提出了一種基於空洞卷積和N-gram語言模型的ICD自動編碼方法,利用空洞卷積捕獲非嚴格匹配的語義片段証據,利用 N-gram 捕獲嚴格匹配的語義片段証據,進而二者聯合使用,共同提升預測結果的可解釋性。可解釋的結果對臨床醫學決策具有重要意義。

在醫療領域,雲知聲-中科院自動化所語言與知識計算聯合實驗室基於自然語言處理技術構建的醫療知識圖譜已儲備約 50萬醫學概念,超過169萬醫學術語庫和398萬醫學關系庫,涵蓋了絕大部分藥品、疾病、科室與檢查,規模達國際領先水准,並在語音病歷,病歷生成、病歷質控、輔助診斷系統等具體應用中發揮重要支撐。

(責編:董志雯、軒召強)
掃描關注上海頻道微信掃描關注上海頻道微信 掃描關注上海頻道微博掃描關注上海頻道微博