一種針對易混淆運動損傷實體詞的識別方法
基本信息
申請?zhí)?/td> | CN202110682430.6 | 申請日 | - |
公開(公告)號 | CN113297851A | 公開(公告)日 | 2021-08-24 |
申請公布號 | CN113297851A | 申請公布日 | 2021-08-24 |
分類號 | G06F40/295;G06F40/126;G06F16/35;G06K9/62;G16H70/00 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李瑞瑞;李爽;趙偉 | 申請(專利權)人 | 北京富通東方科技有限公司 |
代理機構 | - | 代理人 | - |
地址 | 100086 北京市海淀區(qū)知春路128號泛亞大廈七層793室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種針對易混淆運動損傷實體詞的識別方法,基于運動損傷領域的大規(guī)模文本語料,訓練word2vec語義模型,將所述文本語料切割生成字符向量文本和詞匯向量文本,采用自動標注工具標注訓練集、驗證集和測試集的字符向量文本和詞匯向量文本;為所述字符向量文本和詞匯向量文本創(chuàng)建編碼并計算所述字符向量文本和詞匯向量文本的相對位置編碼。然后對字符向量文本和詞匯向量文本進行第一次鑒別,得到所述字符向量文本和詞匯向量文本的預測標簽。將預測標簽為癥狀、體征、檢查結果和檢驗結果的實體詞歸類為待確定組,進行二次鑒別。通過上述方式,本發(fā)明能夠有效鑒別運動損傷領域中實體詞的類別。 |
