分詞方法和分詞系統(tǒng)
基本信息
申請?zhí)?/td> | CN201610251640.9 | 申請日 | - |
公開(公告)號 | CN105893353A | 公開(公告)日 | 2016-08-24 |
申請公布號 | CN105893353A | 申請公布日 | 2016-08-24 |
分類號 | G06F17/27(2006.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 陳炳標 | 申請(專利權)人 | 廣州有啦網絡科技有限公司 |
代理機構 | 廣州華進聯合專利商標代理有限公司 | 代理人 | 潘桂生 |
地址 | 510665 廣東省廣州市天河區(qū)科韻路20號九層901房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種分詞方法和分詞系統(tǒng),所述方法包括:接收輸入的待測文本;根據預設劃分標識對待測文本進行劃分;根據預先建立的字典分別對各個新文本進行正向最大匹配分詞和反向最大匹配分詞;比較兩次匹配后的分詞結果是否相同;當比較結果相同時,輸出任意一個匹配后的分詞結果;當比較結果不同時,根據所述字典分別計算兩次匹配后的分詞結果中各個詞的詞頻;判斷兩次匹配后的分詞結果中各個詞的詞頻是否符合第一要求;當判定不符合時,根據所述字典分別判斷兩次匹配后的分詞結果的語法是否正確;當判定正向匹配分詞結果的語法正確時,輸出正向匹配分詞結果,否則輸出反向匹配分詞結果。本發(fā)明提高分詞速度和準確率,滿足實際應用需要。 |
