一種基于多層隱馬模型的分詞方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010531204.3 申請日 -
公開(公告)號 CN111767734A 公開(公告)日 2020-10-13
申請公布號 CN111767734A 申請公布日 2020-10-13
分類號 G06F40/295(2020.01)I;G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李強;余祥;朱峰;陳立哲;李騰飛;顧正海 申請(專利權(quán))人 安徽旅賁科技有限公司
代理機構(gòu) 合肥天明專利事務(wù)所(普通合伙) 代理人 安徽旅賁科技有限公司
地址 230000安徽省合肥市高新區(qū)華佗巷103號國科軍通協(xié)同創(chuàng)新產(chǎn)業(yè)園A座212
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于多層隱馬模型的分詞方法及系統(tǒng),屬于人工智能技術(shù)領(lǐng)域,包括:對輸入的原始字符串進行預(yù)處理,得到初步分詞的二元切分詞圖;利用多層隱馬模型對原始字符串進行未登錄詞識別,以對初步分詞的二元切分詞圖進行修正,得到修正后的二元切分詞圖;利用基于詞分類的隱馬模型對修正后的二元切分詞圖進行處理,得到所述原始字符串對應(yīng)的分詞序列。本發(fā)明有效將機器學(xué)習(xí)算法和詞典相結(jié)合,兼顧運行效率和準確率。??