一種熱詞獲取方法、語(yǔ)音識(shí)別方法及相關(guān)設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202011571404.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112735428A 公開(kāi)(公告)日 2021-04-30
申請(qǐng)公布號(hào) CN112735428A 申請(qǐng)公布日 2021-04-30
分類(lèi)號(hào) G10L15/26;G10L15/183;G06F40/284;G06F40/242;G06F40/232;G06F40/216;G06F40/211;G06F40/166 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 朱菊霞;萬(wàn)根順;高建清 申請(qǐng)(專(zhuān)利權(quán))人 科大訊飛(上海)科技有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張柳
地址 200050 上海市長(zhǎng)寧區(qū)廣順路33號(hào)8幢一層1966室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N熱詞獲取方法、語(yǔ)音識(shí)別方法及相關(guān)設(shè)備,其中,熱詞獲取方法包括:獲取目標(biāo)用戶的歷史文本數(shù)據(jù);基于歷史文本數(shù)據(jù)的編輯行為和/或歷史文本數(shù)據(jù)所包含詞的特征從歷史文本數(shù)據(jù)中抽取候選熱詞,以得到候選熱詞集;基于候選熱詞集中每個(gè)候選熱詞的發(fā)音,采用模糊音匹配的方式獲取候選熱詞集中每個(gè)候選熱詞對(duì)應(yīng)的擴(kuò)展詞;根據(jù)候選熱詞集中每個(gè)候選熱詞對(duì)應(yīng)的擴(kuò)展詞,從候選熱詞集中過(guò)濾掉非熱詞,以得到目標(biāo)用戶的熱詞集。經(jīng)由上述方法可獲得高質(zhì)量熱詞,在進(jìn)行語(yǔ)音識(shí)別時(shí),輔以高質(zhì)量熱詞,能夠提升語(yǔ)音識(shí)別效果。