多音字消歧方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110577910.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113380223A 公開(kāi)(公告)日 2021-09-10
申請(qǐng)公布號(hào) CN113380223A 申請(qǐng)公布日 2021-09-10
分類(lèi)號(hào) G10L13/08(2013.01)I;G10L13/04(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 張海騰;李秀林 申請(qǐng)(專(zhuān)利權(quán))人 標(biāo)貝(北京)科技有限公司
代理機(jī)構(gòu) 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 徐丁峰;戴亞南
地址 100192北京市海淀區(qū)西小口路66號(hào)中關(guān)村東升科技園·北領(lǐng)地B-2樓3層B303A
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種多音字消歧方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)。方法包括:獲取待處理文本;從待處理文本中識(shí)別目標(biāo)多音字字符;從待處理文本中識(shí)別一個(gè)或多個(gè)目標(biāo)詞,一個(gè)或多個(gè)目標(biāo)詞中的每一個(gè)包含目標(biāo)多音字字符;利用多音字詞典確定與一個(gè)或多個(gè)目標(biāo)詞一一對(duì)應(yīng)的一組或多組字符發(fā)音信息,每組字符發(fā)音信息用于表示在對(duì)應(yīng)目標(biāo)詞中目標(biāo)多音字字符的發(fā)音,多音字詞典用于記錄至少一個(gè)多音字字符中的每個(gè)多音字字符在包含該多音字字符的多個(gè)詞中的發(fā)音;至少基于一組或多組字符發(fā)音信息生成輸入特征;將輸入特征輸入多音字消歧模型,以獲得目標(biāo)多音字字符的預(yù)測(cè)發(fā)音結(jié)果。有助于提高多音字消歧的處理效率和預(yù)測(cè)準(zhǔn)確率。