一種基于多層隱馬模型的分詞方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202010531204.3 | 申請日 | - |
公開(公告)號 | CN111767734A | 公開(公告)日 | 2020-10-13 |
申請公布號 | CN111767734A | 申請公布日 | 2020-10-13 |
分類號 | G06F40/295(2020.01)I;G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李強;余祥;朱峰;陳立哲;李騰飛;顧正海 | 申請(專利權(quán))人 | 安徽旅賁科技有限公司 |
代理機構(gòu) | 合肥天明專利事務(wù)所(普通合伙) | 代理人 | 安徽旅賁科技有限公司 |
地址 | 230000安徽省合肥市高新區(qū)華佗巷103號國科軍通協(xié)同創(chuàng)新產(chǎn)業(yè)園A座212 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于多層隱馬模型的分詞方法及系統(tǒng),屬于人工智能技術(shù)領(lǐng)域,包括:對輸入的原始字符串進行預(yù)處理,得到初步分詞的二元切分詞圖;利用多層隱馬模型對原始字符串進行未登錄詞識別,以對初步分詞的二元切分詞圖進行修正,得到修正后的二元切分詞圖;利用基于詞分類的隱馬模型對修正后的二元切分詞圖進行處理,得到所述原始字符串對應(yīng)的分詞序列。本發(fā)明有效將機器學(xué)習(xí)算法和詞典相結(jié)合,兼顧運行效率和準確率。?? |
