一種實(shí)時分離音頻的方法和裝置

基本信息

申請?zhí)?/td> CN201810608988.8 申請日 -
公開(公告)號 CN108769874B 公開(公告)日 2018-11-06
申請公布號 CN108769874B 申請公布日 2018-11-06
分類號 H04R3/12(2006.01)I 分類 電通信技術(shù);
發(fā)明人 王澤龍;陳昊亮 申請(專利權(quán))人 廣州國視科技有限公司
代理機(jī)構(gòu) 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 廣州國音科技有限公司
地址 510000廣東省廣州市南沙區(qū)豐澤東路106號(自編1號樓)X1301-A4423(集群注冊)(JM)
法律狀態(tài) -

摘要

摘要 本申請公開了一種實(shí)時分離音頻的方法和裝置,通過從含有復(fù)數(shù)個麥克風(fēng)的錄音裝置中獲取待聲音分離的音頻,每個麥克風(fēng)所錄制到的聲音占一個聲道,計算出聲源到達(dá)圓周上處于同一直徑上的兩個麥克風(fēng)的時間差和采樣頻率;每一段音頻,都有對應(yīng)的聲譜圖,直接獲取到待聲音分離的音頻的聲譜圖,在聲譜圖中每個采樣點(diǎn)都有對應(yīng)的能量值,計算在時間t內(nèi)聲源到達(dá)每個麥克風(fēng)的所有采樣點(diǎn)的總能量和聲源到達(dá)與該麥克風(fēng)處于同一直徑上的所有采樣點(diǎn)的總能量的余弦值,分離出余弦值最大時對應(yīng)的麥克風(fēng)所在的聲道作為聲源的聲道,提取該聲道的音頻生成音頻文件。解決了現(xiàn)有的聲音分離方法不具備實(shí)時性,耗費(fèi)時間,效率低下,人工成本高的技術(shù)問題。??