中文分詞方法、訓練設備以及計算機可讀存儲介質
基本信息
申請?zhí)?/td> | CN202010297380.5 | 申請日 | - |
公開(公告)號 | CN111666758B | 公開(公告)日 | 2022-03-22 |
申請公布號 | CN111666758B | 申請公布日 | 2022-03-22 |
分類號 | G06F40/289(2020.01)I;G06F40/242(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 趙笑艷;楊敏;曲強;賀倩明 | 申請(專利權)人 | 深圳得理科技有限公司 |
代理機構 | 深圳市威世博知識產權代理事務所(普通合伙) | 代理人 | 李慶波 |
地址 | 518055廣東省深圳市南山區(qū)深圳大學城學苑大道1068號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N中文分詞方法、訓練設備以及計算機可讀存儲介質,該方法包括:將待分詞文本中的字符轉化為字符特征信息向量;提取每個字符特征信息向量的上下文特征向量;從詞典中獲取每個句子對應的候選詞集合,并利用自適應注意力機制計算上下文特征向量和候選詞集合中的每個候選詞的語義關系,得到上下文特征向量對詞典的詞感知表示;將上下文特征向量和詞感知表示進行信息融合,獲得包含詞信息和上下文信息的詞感知上下文表示;根據(jù)詞感知上下文表示確定相鄰字之間的依賴關系,從而對待分詞文本進行分詞。本申請?zhí)峁┑闹形姆衷~方法能夠提高中文分詞的準確性。 |
