一種應(yīng)用于電力調(diào)度領(lǐng)域的語音識別方法及裝置
基本信息
申請?zhí)?/td> | CN201911002395.8 | 申請日 | - |
公開(公告)號 | CN110689880A | 公開(公告)日 | 2020-01-14 |
申請公布號 | CN110689880A | 申請公布日 | 2020-01-14 |
分類號 | G10L15/16;G10L15/26;G10L15/02;G10L15/06;G10L15/20;G10L15/07;G10L25/24 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 鄢發(fā)齊;汪旸;王春明;程迪;陳鐘鐘;劉志成;徐浩;董向明;孫濤;吳怡菲;曲亮;金勇 | 申請(專利權(quán))人 | 武漢烽火普天信息技術(shù)有限公司 |
代理機構(gòu) | 武漢維創(chuàng)品智專利代理事務(wù)所(特殊普通合伙) | 代理人 | 武漢烽火普天信息技術(shù)有限公司;國家電網(wǎng)公司華中分部 |
地址 | 430077 湖北省武漢市武昌區(qū)徐東大街231號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供一種應(yīng)用于電力調(diào)度領(lǐng)域的語音識別方法及裝置。包括:將待識別語音的功率歸一化倒譜系數(shù)特征輸入至預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型中的卷積神經(jīng)網(wǎng)絡(luò),得到新的特征;將新的特征、功率歸一化倒譜系數(shù)特征和說話人特征進行拼接,得到混合特征;將混合特征輸入至預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型中的若干組交替設(shè)置的時間延遲神經(jīng)網(wǎng)絡(luò)和雙向長短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò),得到詞序列集合針對待識別語音特征的后驗概率;根據(jù)后驗概率結(jié)合語言模型對待識別語音進行解碼,得到識別出的詞序列。在電力調(diào)度領(lǐng)域提出基于上述三個網(wǎng)絡(luò)的語音識別聲學(xué)模型多網(wǎng)絡(luò)混合訓(xùn)練方法,使得能夠通過訓(xùn)練好的模型對待識別語音進行識別,降低調(diào)度員的工作強度并縮短其重復(fù)性工作的時間。 |
