一種對垂直領(lǐng)域短視頻ASR文本關(guān)鍵詞的抽取方法、計算機(jī)設(shè)備及可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011537896.9 申請日 -
公開(公告)號 CN112597340A 公開(公告)日 2021-04-02
申請公布號 CN112597340A 申請公布日 2021-04-02
分類號 G06F16/783(2019.01)I;G06F40/232(2020.01)I;G06F40/284(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王磊;黃穎驊 申請(專利權(quán))人 杭州艾耕科技有限公司
代理機(jī)構(gòu) 杭州天昊專利代理事務(wù)所(特殊普通合伙) 代理人 何碧珩;卓彩霞
地址 310052浙江省杭州市濱江區(qū)六和路368號一幢(北)三樓D3052室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種對垂直領(lǐng)域短視頻ASR文本關(guān)鍵詞的抽取方法、計算機(jī)設(shè)備及可讀存儲介質(zhì),本發(fā)明能夠?qū)Χ桃曨l口語化文本進(jìn)行糾錯,在短視頻口語化文本上定義關(guān)鍵詞類型,結(jié)合領(lǐng)域詞表,專家系統(tǒng)的特殊類型關(guān)鍵詞抽取模型和基于深度學(xué)習(xí)的關(guān)鍵詞抽取模型共同抽取關(guān)鍵詞,并對最終結(jié)果做后處理進(jìn)行篩選。本發(fā)明的提取方法不僅優(yōu)化了口語化文本自身的準(zhǔn)確性,提高關(guān)鍵詞抽取的召回率,而且豐富了關(guān)鍵詞的抽取類型,并結(jié)合后處理做到了關(guān)鍵詞抽取的可控性。??