一種針對易混淆運動損傷實體詞的識別方法

基本信息

申請?zhí)?/td> CN202110682430.6 申請日 -
公開(公告)號 CN113297851A 公開(公告)日 2021-08-24
申請公布號 CN113297851A 申請公布日 2021-08-24
分類號 G06F40/295;G06F40/126;G06F16/35;G06K9/62;G16H70/00 分類 計算;推算;計數(shù);
發(fā)明人 李瑞瑞;李爽;趙偉 申請(專利權)人 北京富通東方科技有限公司
代理機構 - 代理人 -
地址 100086 北京市海淀區(qū)知春路128號泛亞大廈七層793室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種針對易混淆運動損傷實體詞的識別方法,基于運動損傷領域的大規(guī)模文本語料,訓練word2vec語義模型,將所述文本語料切割生成字符向量文本和詞匯向量文本,采用自動標注工具標注訓練集、驗證集和測試集的字符向量文本和詞匯向量文本;為所述字符向量文本和詞匯向量文本創(chuàng)建編碼并計算所述字符向量文本和詞匯向量文本的相對位置編碼。然后對字符向量文本和詞匯向量文本進行第一次鑒別,得到所述字符向量文本和詞匯向量文本的預測標簽。將預測標簽為癥狀、體征、檢查結果和檢驗結果的實體詞歸類為待確定組,進行二次鑒別。通過上述方式,本發(fā)明能夠有效鑒別運動損傷領域中實體詞的類別。