一種段落分割方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201810961760.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109241526A | 公開(公告)日 | 2019-01-18 |
申請(qǐng)公布號(hào) | CN109241526A | 申請(qǐng)公布日 | 2019-01-18 |
分類號(hào) | G06F17/27;G06F16/35;G10L15/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 任燦 | 申請(qǐng)(專利權(quán))人 | 北京慕華信息科技有限公司 |
代理機(jī)構(gòu) | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 北京慕華信息科技有限公司 |
地址 | 100083 北京市海淀區(qū)中關(guān)村東路1號(hào)院6號(hào)樓8層801室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝艘环N段落分割方法和裝置,其中,段落分割方法包括:獲取待分割音視頻文件的文本內(nèi)容中包括各個(gè)句子的句子向量;根據(jù)各個(gè)句子的時(shí)間序列,獲取各個(gè)句子的語速信息;根據(jù)該句子的語速信息,以及與其相鄰的下個(gè)句子的語速信息,計(jì)算該句子的語速相關(guān)性系數(shù);根據(jù)目標(biāo)特征權(quán)重和語速相關(guān)性系數(shù),計(jì)算拼接元素;將拼接元素和該句子的句子向量中的元素進(jìn)行拼接,生成該句子的語速上下文向量;基于各個(gè)語速上下文向量之間的距離對(duì)句子進(jìn)行分類,得到段落分割結(jié)果。該段落分割方法,能夠充分利用音視頻中發(fā)言者的語速對(duì)段落分割的影響,解決了現(xiàn)有技術(shù)中單純借助文本的內(nèi)容使得段落分割結(jié)果雜亂無章的問題,使得段落分割結(jié)果更加準(zhǔn)確。 |
