一種段落分割方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810961760.7 申請(qǐng)日 -
公開(公告)號(hào) CN109241526A 公開(公告)日 2019-01-18
申請(qǐng)公布號(hào) CN109241526A 申請(qǐng)公布日 2019-01-18
分類號(hào) G06F17/27;G06F16/35;G10L15/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 任燦 申請(qǐng)(專利權(quán))人 北京慕華信息科技有限公司
代理機(jī)構(gòu) 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京慕華信息科技有限公司
地址 100083 北京市海淀區(qū)中關(guān)村東路1號(hào)院6號(hào)樓8層801室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N段落分割方法和裝置,其中,段落分割方法包括:獲取待分割音視頻文件的文本內(nèi)容中包括各個(gè)句子的句子向量;根據(jù)各個(gè)句子的時(shí)間序列,獲取各個(gè)句子的語速信息;根據(jù)該句子的語速信息,以及與其相鄰的下個(gè)句子的語速信息,計(jì)算該句子的語速相關(guān)性系數(shù);根據(jù)目標(biāo)特征權(quán)重和語速相關(guān)性系數(shù),計(jì)算拼接元素;將拼接元素和該句子的句子向量中的元素進(jìn)行拼接,生成該句子的語速上下文向量;基于各個(gè)語速上下文向量之間的距離對(duì)句子進(jìn)行分類,得到段落分割結(jié)果。該段落分割方法,能夠充分利用音視頻中發(fā)言者的語速對(duì)段落分割的影響,解決了現(xiàn)有技術(shù)中單純借助文本的內(nèi)容使得段落分割結(jié)果雜亂無章的問題,使得段落分割結(jié)果更加準(zhǔn)確。