一種實(shí)時(shí)分離音頻的方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810608988.8 申請(qǐng)日 -
公開(公告)號(hào) CN108769874A 公開(公告)日 2018-11-06
申請(qǐng)公布號(hào) CN108769874A 申請(qǐng)公布日 2018-11-06
分類號(hào) H04R3/12;G10L21/02;G01S5/28 分類 電通信技術(shù);
發(fā)明人 王澤龍;陳昊亮 申請(qǐng)(專利權(quán))人 廣州國(guó)視科技有限公司
代理機(jī)構(gòu) 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 廣州國(guó)音科技有限公司
地址 510000 廣東省廣州市南沙區(qū)豐澤東路106號(hào)(自編1號(hào)樓)X1301-A4423(集群注冊(cè))(JM)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種實(shí)時(shí)分離音頻的方法和裝置,通過從含有復(fù)數(shù)個(gè)麥克風(fēng)的錄音裝置中獲取待聲音分離的音頻,每個(gè)麥克風(fēng)所錄制到的聲音占一個(gè)聲道,計(jì)算出聲源到達(dá)圓周上處于同一直徑上的兩個(gè)麥克風(fēng)的時(shí)間差和采樣頻率;每一段音頻,都有對(duì)應(yīng)的聲譜圖,直接獲取到待聲音分離的音頻的聲譜圖,在聲譜圖中每個(gè)采樣點(diǎn)都有對(duì)應(yīng)的能量值,計(jì)算在時(shí)間t內(nèi)聲源到達(dá)每個(gè)麥克風(fēng)的所有采樣點(diǎn)的總能量和聲源到達(dá)與該麥克風(fēng)處于同一直徑上的所有采樣點(diǎn)的總能量的余弦值,分離出余弦值最大時(shí)對(duì)應(yīng)的麥克風(fēng)所在的聲道作為聲源的聲道,提取該聲道的音頻生成音頻文件。解決了現(xiàn)有的聲音分離方法不具備實(shí)時(shí)性,耗費(fèi)時(shí)間,效率低下,人工成本高的技術(shù)問題。