一種基于醫(yī)學(xué)專業(yè)詞典與統(tǒng)計(jì)算法的分詞方法
基本信息
申請(qǐng)?zhí)?/td> | CN201810478904.3 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110502737A | 公開(公告)日 | 2019-11-26 |
申請(qǐng)公布號(hào) | CN110502737A | 申請(qǐng)公布日 | 2019-11-26 |
分類號(hào) | G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 朱衛(wèi)國;沙歐;聞思源;趙從樸 | 申請(qǐng)(專利權(quán))人 | 睿醫(yī)(北京)數(shù)據(jù)技術(shù)有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 100000 北京市東城區(qū)王府井帥府園1號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于醫(yī)學(xué)專業(yè)詞典與統(tǒng)計(jì)算法的分詞方法,包括以下步驟:語料預(yù)處理、候選詞條的表達(dá)與產(chǎn)生實(shí)現(xiàn)、分詞結(jié)果判別、分詞結(jié)果的歧義消除、醫(yī)學(xué)詞典的構(gòu)造和未登錄詞的發(fā)現(xiàn)。本發(fā)明有效解決了當(dāng)前無針對(duì)中文醫(yī)學(xué)語料的專用分詞方法模型和系統(tǒng)的問題,提升中文醫(yī)學(xué)語料分詞準(zhǔn)確率、召回率和F值等關(guān)鍵評(píng)價(jià)指標(biāo)。 |
