分詞方法和分詞系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201610251640.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN105893353B | 公開(公告)日 | 2018-10-26 |
申請(qǐng)公布號(hào) | CN105893353B | 申請(qǐng)公布日 | 2018-10-26 |
分類號(hào) | G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳炳標(biāo) | 申請(qǐng)(專利權(quán))人 | 廣州有啦網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 | 代理人 | 廣東萬丈金數(shù)信息技術(shù)股份有限公司;廣州要啦網(wǎng)絡(luò)有限公司 |
地址 | 510665 廣東省廣州市天河區(qū)科韻路20號(hào)九層901房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種分詞方法和分詞系統(tǒng),所述方法包括:接收輸入的待測文本;根據(jù)預(yù)設(shè)劃分標(biāo)識(shí)對(duì)待測文本進(jìn)行劃分;根據(jù)預(yù)先建立的字典分別對(duì)各個(gè)新文本進(jìn)行正向最大匹配分詞和反向最大匹配分詞;比較兩次匹配后的分詞結(jié)果是否相同;當(dāng)比較結(jié)果相同時(shí),輸出任意一個(gè)匹配后的分詞結(jié)果;當(dāng)比較結(jié)果不同時(shí),根據(jù)所述字典分別計(jì)算兩次匹配后的分詞結(jié)果中各個(gè)詞的詞頻;判斷兩次匹配后的分詞結(jié)果中各個(gè)詞的詞頻是否符合第一要求;當(dāng)判定不符合時(shí),根據(jù)所述字典分別判斷兩次匹配后的分詞結(jié)果的語法是否正確;當(dāng)判定正向匹配分詞結(jié)果的語法正確時(shí),輸出正向匹配分詞結(jié)果,否則輸出反向匹配分詞結(jié)果。本發(fā)明提高分詞速度和準(zhǔn)確率,滿足實(shí)際應(yīng)用需要。 |
