一種熱詞獲取方法、語(yǔ)音識(shí)別方法及相關(guān)設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202011571404.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112735428A | 公開(kāi)(公告)日 | 2021-04-30 |
申請(qǐng)公布號(hào) | CN112735428A | 申請(qǐng)公布日 | 2021-04-30 |
分類(lèi)號(hào) | G10L15/26;G10L15/183;G06F40/284;G06F40/242;G06F40/232;G06F40/216;G06F40/211;G06F40/166 | 分類(lèi) | 樂(lè)器;聲學(xué); |
發(fā)明人 | 朱菊霞;萬(wàn)根順;高建清 | 申請(qǐng)(專(zhuān)利權(quán))人 | 科大訊飛(上海)科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 張柳 |
地址 | 200050 上海市長(zhǎng)寧區(qū)廣順路33號(hào)8幢一層1966室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝艘环N熱詞獲取方法、語(yǔ)音識(shí)別方法及相關(guān)設(shè)備,其中,熱詞獲取方法包括:獲取目標(biāo)用戶的歷史文本數(shù)據(jù);基于歷史文本數(shù)據(jù)的編輯行為和/或歷史文本數(shù)據(jù)所包含詞的特征從歷史文本數(shù)據(jù)中抽取候選熱詞,以得到候選熱詞集;基于候選熱詞集中每個(gè)候選熱詞的發(fā)音,采用模糊音匹配的方式獲取候選熱詞集中每個(gè)候選熱詞對(duì)應(yīng)的擴(kuò)展詞;根據(jù)候選熱詞集中每個(gè)候選熱詞對(duì)應(yīng)的擴(kuò)展詞,從候選熱詞集中過(guò)濾掉非熱詞,以得到目標(biāo)用戶的熱詞集。經(jīng)由上述方法可獲得高質(zhì)量熱詞,在進(jìn)行語(yǔ)音識(shí)別時(shí),輔以高質(zhì)量熱詞,能夠提升語(yǔ)音識(shí)別效果。 |
