一種基于未標(biāo)注關(guān)鍵詞數(shù)據(jù)的關(guān)鍵詞檢測(cè)方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110810561.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113282785A | 公開(公告)日 | 2021-08-20 |
申請(qǐng)公布號(hào) | CN113282785A | 申請(qǐng)公布日 | 2021-08-20 |
分類號(hào) | G06F16/65(2019.01)I;G06F16/683(2019.01)I;G06F16/68(2019.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 阮曉輝;魏慶凱 | 申請(qǐng)(專利權(quán))人 | 北京快魚電子股份公司 |
代理機(jī)構(gòu) | 北京天盾知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 張彩珍 |
地址 | 100093北京市海淀區(qū)閔莊路3號(hào)清華科技園玉泉慧谷3棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于未標(biāo)注關(guān)鍵詞數(shù)據(jù)的關(guān)鍵詞檢測(cè)方法及系統(tǒng),包括采集大量的未標(biāo)注音頻數(shù)據(jù),在未標(biāo)注音頻數(shù)據(jù)中添加預(yù)設(shè)的喚醒詞音頻和非喚醒詞音頻,構(gòu)成預(yù)處理音頻庫(kù);基于無(wú)監(jiān)督深度學(xué)習(xí)分類方法對(duì)預(yù)處理音頻庫(kù)中的音頻數(shù)據(jù)進(jìn)行分類;對(duì)分類后的音頻數(shù)據(jù)提取特征以生成特征數(shù)據(jù);將特征數(shù)據(jù)分別輸入至不同類型的神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練以得到多個(gè)不同的關(guān)鍵詞檢測(cè)模型;基于多個(gè)不同的關(guān)鍵詞檢測(cè)模型對(duì)待預(yù)測(cè)音頻進(jìn)行檢測(cè)以得到最終檢測(cè)結(jié)果;該方法對(duì)音頻數(shù)據(jù)進(jìn)行綜合對(duì)比分類訓(xùn)練,分類準(zhǔn)確率更高。 |
