口語發(fā)音質量評價方法、裝置、設備及存儲介質
基本信息
申請?zhí)?/td> | CN202011480460.0 | 申請日 | - |
公開(公告)號 | CN112700795A | 公開(公告)日 | 2021-04-23 |
申請公布號 | CN112700795A | 申請公布日 | 2021-04-23 |
分類號 | G10L25/60;G10L25/30 | 分類 | 樂器;聲學; |
發(fā)明人 | 蔣國雷;李坤;劉鵬飛;廖春紅 | 申請(專利權)人 | 深圳市聲??萍加邢薰?/a> |
代理機構 | 深圳市恒程創(chuàng)新知識產權代理有限公司 | 代理人 | 劉冰 |
地址 | 518000 廣東省深圳市新安街道興東社區(qū)留仙大道2號匯聚創(chuàng)新園2棟2710 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于語音識別技術領域,公開了一種口語發(fā)音質量評價方法、裝置、設備及存儲介質。該方法包括:獲取待測試人員的多條句子級語音信號;根據(jù)所述句子級語音信號確定一一對應的句子級后驗概率分布分數(shù);將所述句子級后驗概率分布分數(shù)通過訓練好的預設質量評價神經網絡進行質量評價,得到所述待測試人員的口語發(fā)音質量評價結果。通過上述方式,根據(jù)說話人的多條句子級語音信號確定句子級后驗概率分布分數(shù),多條句子級后驗概率分布分數(shù)作為說話人級別的特征,包含說話人發(fā)音的詳細信息以及發(fā)音優(yōu)度,更具有解釋性,引用訓練好的預設質量評價神經網絡對多條句子級后驗概率分布分數(shù)進行質量評價,提高了口音分類的精度以及穩(wěn)定性。 |
