一種實時分角色轉錄方法、設備和系統(tǒng)

基本信息

申請?zhí)?/td> CN202011477913.4 申請日 -
公開(公告)號 CN112530411B 公開(公告)日 2021-07-20
申請公布號 CN112530411B 申請公布日 2021-07-20
分類號 G10L15/04;G10L15/08;G10L15/26;G10L25/03;G10L25/51 分類 樂器;聲學;
發(fā)明人 袁斌 申請(專利權)人 北京快魚電子股份公司
代理機構 北京天盾知識產(chǎn)權代理有限公司 代理人 張彩珍
地址 100093 北京市海淀區(qū)閔莊路3號清華科技園玉泉慧谷11棟
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種實時分角色轉錄方法,包括檢測采集到的左聲道聲音信號和右聲道聲音信號中是否含有語音段,若檢測到語音段,則提取語音段對應的左聲道語音段和右聲道語音段;基于左聲道語音段和右聲道語音段的相位差、幅度差和基頻檢測,判斷單雙側講話;若為單側講話,則判斷說話人是位于左側還是右側;若說話人位于左側,則將左聲道語音段進行聚類形成左側聚類中心;若說話人位于右側,則將右聲道語音段進行聚類形成右側聚類中心;若為雙側講話,則分離左聲道語音段和右聲道語音段中包含的左右側語音信號;并將分離后的左側語音信號和右側語音信號發(fā)送至語音識別引擎;該方法能對角色做到準確的分離。本發(fā)明還公開了實時分角色轉錄設備及系統(tǒng)。