一種中文分詞方法、裝置以及搜索詞庫讀取方法

基本信息

申請?zhí)?/td> CN202110434688.4 申請日 -
公開(公告)號 CN113111651A 公開(公告)日 2021-07-13
申請公布號 CN113111651A 申請公布日 2021-07-13
分類號 G06F40/284;G06F16/33;G06F16/338 分類 計算;推算;計數(shù);
發(fā)明人 葉群莉;魏文華;李彩秀;劉寧;農(nóng)翠華 申請(專利權(quán))人 深圳市華南城數(shù)字科技有限公司
代理機構(gòu) 深圳智趣知識產(chǎn)權(quán)代理事務所(普通合伙) 代理人 李興生
地址 518000 廣東省深圳市龍崗區(qū)平湖街道禾花社區(qū)華南大道一號華南城總部大樓801
法律狀態(tài) -

摘要

摘要 為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種中文分詞方法、裝置以及搜索詞庫讀取方法,包括:根據(jù)輸入的最大詞長,對待分詞語句進行分詞,得到第一次分詞結(jié)果;將最大詞長的長度逐漸減少,并且在每一次最大詞長發(fā)生變化時,都對所述待分詞語句進行分詞,得到第N次分詞結(jié)果;將第一次分詞結(jié)果直至第N次分詞結(jié)果分別與詞庫比較,得到輸出列表。本發(fā)明能夠準確的對待分詞語句進行分詞,尤其能夠提升位于待分詞語句中間的固定詞語的識別率。本發(fā)明所述的方法具有分詞效率高,分詞結(jié)果準確的優(yōu)點。