一種對垂直領(lǐng)域短視頻ASR文本關(guān)鍵詞的抽取方法、計算機(jī)設(shè)備及可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011537896.9 | 申請日 | - |
公開(公告)號 | CN112597340A | 公開(公告)日 | 2021-04-02 |
申請公布號 | CN112597340A | 申請公布日 | 2021-04-02 |
分類號 | G06F16/783(2019.01)I;G06F40/232(2020.01)I;G06F40/284(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王磊;黃穎驊 | 申請(專利權(quán))人 | 杭州艾耕科技有限公司 |
代理機(jī)構(gòu) | 杭州天昊專利代理事務(wù)所(特殊普通合伙) | 代理人 | 何碧珩;卓彩霞 |
地址 | 310052浙江省杭州市濱江區(qū)六和路368號一幢(北)三樓D3052室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種對垂直領(lǐng)域短視頻ASR文本關(guān)鍵詞的抽取方法、計算機(jī)設(shè)備及可讀存儲介質(zhì),本發(fā)明能夠?qū)Χ桃曨l口語化文本進(jìn)行糾錯,在短視頻口語化文本上定義關(guān)鍵詞類型,結(jié)合領(lǐng)域詞表,專家系統(tǒng)的特殊類型關(guān)鍵詞抽取模型和基于深度學(xué)習(xí)的關(guān)鍵詞抽取模型共同抽取關(guān)鍵詞,并對最終結(jié)果做后處理進(jìn)行篩選。本發(fā)明的提取方法不僅優(yōu)化了口語化文本自身的準(zhǔn)確性,提高關(guān)鍵詞抽取的召回率,而且豐富了關(guān)鍵詞的抽取類型,并結(jié)合后處理做到了關(guān)鍵詞抽取的可控性。?? |
