輸入法多元詞發(fā)現(xiàn)方法及裝置

基本信息

申請?zhí)?/td> CN202110493402.X 申請日 -
公開(公告)號(hào) CN113204963A 公開(公告)日 2021-08-03
申請公布號(hào) CN113204963A 申請公布日 2021-08-03
分類號(hào) G06F40/289(2020.01)I;G06F16/31(2019.01)I;G06F3/023(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 沈哲吉;賈昌鑫;鮑寧;孫明東 申請(專利權(quán))人 北京華宇信息技術(shù)有限公司
代理機(jī)構(gòu) 北京中索知識(shí)產(chǎn)權(quán)代理有限公司 代理人 胡大成
地址 100084北京市海淀區(qū)中關(guān)村東路1號(hào)院8號(hào)樓21層C2301、C2302
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N輸入法多元詞發(fā)現(xiàn)方法及裝置,用于解決輸入法發(fā)現(xiàn)多元詞效率低的技術(shù)問題。其中,一種輸入法多元詞發(fā)現(xiàn)方法,包括以下步驟:獲取語料數(shù)據(jù);通過分詞模型,對(duì)所述語料數(shù)據(jù)進(jìn)行分詞,生成若干分詞單元;以WFP數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)分詞單元;通過讀取WFP數(shù)據(jù)結(jié)構(gòu),比較分詞單元與分詞單元的關(guān)聯(lián)性,確定分詞單元組合;添加所述分詞單元組合至詞庫。相對(duì)于現(xiàn)有技術(shù),所述輸入法多元詞發(fā)現(xiàn)方法能實(shí)現(xiàn)多元詞關(guān)系的發(fā)現(xiàn),并且提高了發(fā)現(xiàn)多元詞的準(zhǔn)確率、效率。