分詞器獲得方法、裝置及電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202011219865.9 申請(qǐng)日 -
公開(公告)號(hào) CN112101016B 公開(公告)日 2021-03-23
申請(qǐng)公布號(hào) CN112101016B 申請(qǐng)公布日 2021-03-23
分類號(hào) G06F40/284(2020.01)I;G06F40/242(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃詩雅;羅睦軍;朱栩 申請(qǐng)(專利權(quán))人 廣州云趣信息科技有限公司
代理機(jī)構(gòu) 北京博雅睿泉專利代理事務(wù)所(特殊普通合伙) 代理人 馬鐵良
地址 510665廣東省廣州市天河區(qū)建工路4號(hào)6樓
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種分詞器獲得方法,包括:獲取原始文本語料,其中,所述原始文本語料包括第一詞匯和至少一個(gè)第二詞匯,其中,所述第二詞匯用于解釋所述第一詞匯,所述第一詞匯屬于目標(biāo)語種,所述第二詞匯屬于釋義語種;根據(jù)所述至少一個(gè)第二詞匯,獲得所述第一詞匯的目標(biāo)詞性;根據(jù)所述第一詞匯和所述目標(biāo)詞性,獲得與所述目標(biāo)語種對(duì)應(yīng)的目標(biāo)文本語料;根據(jù)所述目標(biāo)文本語料,獲得目標(biāo)分詞器,其中,所述目標(biāo)分詞器用于對(duì)使用所述目標(biāo)語種的文本進(jìn)行分詞處理。該方法可以提升目標(biāo)分詞器進(jìn)行分詞處理時(shí)的可靠性以及準(zhǔn)確性。??