分詞器獲得方法、裝置及電子設(shè)備
基本信息
申請?zhí)?/td> | CN202011219865.9 | 申請日 | - |
公開(公告)號 | CN112101016A | 公開(公告)日 | 2020-12-18 |
申請公布號 | CN112101016A | 申請公布日 | 2020-12-18 |
分類號 | G06F40/284;G06F40/242 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 黃詩雅;羅睦軍;朱栩 | 申請(專利權(quán))人 | 廣州云趣信息科技有限公司 |
代理機構(gòu) | 北京博雅睿泉專利代理事務(wù)所(特殊普通合伙) | 代理人 | 廣州云趣信息科技有限公司 |
地址 | 510665 廣東省廣州市天河區(qū)建工路4號6樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種分詞器獲得方法,包括:獲取原始文本語料,其中,所述原始文本語料包括第一詞匯和至少一個第二詞匯,其中,所述第二詞匯用于解釋所述第一詞匯,所述第一詞匯屬于目標(biāo)語種,所述第二詞匯屬于釋義語種;根據(jù)所述至少一個第二詞匯,獲得所述第一詞匯的目標(biāo)詞性;根據(jù)所述第一詞匯和所述目標(biāo)詞性,獲得與所述目標(biāo)語種對應(yīng)的目標(biāo)文本語料;根據(jù)所述目標(biāo)文本語料,獲得目標(biāo)分詞器,其中,所述目標(biāo)分詞器用于對使用所述目標(biāo)語種的文本進(jìn)行分詞處理。該方法可以提升目標(biāo)分詞器進(jìn)行分詞處理時的可靠性以及準(zhǔn)確性。 |
