一種基于醫(yī)學(xué)專業(yè)詞典與統(tǒng)計(jì)算法的分詞方法

基本信息

申請(qǐng)?zhí)?/td> CN201810478904.3 申請(qǐng)日 -
公開(公告)號(hào) CN110502737A 公開(公告)日 2019-11-26
申請(qǐng)公布號(hào) CN110502737A 申請(qǐng)公布日 2019-11-26
分類號(hào) G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱衛(wèi)國;沙歐;聞思源;趙從樸 申請(qǐng)(專利權(quán))人 睿醫(yī)(北京)數(shù)據(jù)技術(shù)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100000 北京市東城區(qū)王府井帥府園1號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于醫(yī)學(xué)專業(yè)詞典與統(tǒng)計(jì)算法的分詞方法,包括以下步驟:語料預(yù)處理、候選詞條的表達(dá)與產(chǎn)生實(shí)現(xiàn)、分詞結(jié)果判別、分詞結(jié)果的歧義消除、醫(yī)學(xué)詞典的構(gòu)造和未登錄詞的發(fā)現(xiàn)。本發(fā)明有效解決了當(dāng)前無針對(duì)中文醫(yī)學(xué)語料的專用分詞方法模型和系統(tǒng)的問題,提升中文醫(yī)學(xué)語料分詞準(zhǔn)確率、召回率和F值等關(guān)鍵評(píng)價(jià)指標(biāo)。