中文分詞方法、訓(xùn)練設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請?zhí)?/td> CN202010297380.5 申請日 -
公開(公告)號(hào) CN111666758B 公開(公告)日 2022-03-22
申請公布號(hào) CN111666758B 申請公布日 2022-03-22
分類號(hào) G06F40/289(2020.01)I;G06F40/242(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 趙笑艷;楊敏;曲強(qiáng);賀倩明 申請(專利權(quán))人 深圳得理科技有限公司
代理機(jī)構(gòu) 深圳市威世博知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李慶波
地址 518055廣東省深圳市南山區(qū)深圳大學(xué)城學(xué)苑大道1068號(hào)
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N中文分詞方法、訓(xùn)練設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該方法包括:將待分詞文本中的字符轉(zhuǎn)化為字符特征信息向量;提取每個(gè)字符特征信息向量的上下文特征向量;從詞典中獲取每個(gè)句子對(duì)應(yīng)的候選詞集合,并利用自適應(yīng)注意力機(jī)制計(jì)算上下文特征向量和候選詞集合中的每個(gè)候選詞的語義關(guān)系,得到上下文特征向量對(duì)詞典的詞感知表示;將上下文特征向量和詞感知表示進(jìn)行信息融合,獲得包含詞信息和上下文信息的詞感知上下文表示;根據(jù)詞感知上下文表示確定相鄰字之間的依賴關(guān)系,從而對(duì)待分詞文本進(jìn)行分詞。本申請?zhí)峁┑闹形姆衷~方法能夠提高中文分詞的準(zhǔn)確性。