文本處理方法、裝置及計(jì)算機(jī)設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202110144807.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112800747A 公開(kāi)(公告)日 2021-05-14
申請(qǐng)公布號(hào) CN112800747A 申請(qǐng)公布日 2021-05-14
分類號(hào) G06F40/211;G06F16/35;G06F40/44;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 胡韜;熊軍;張繼晟 申請(qǐng)(專利權(quán))人 虎博網(wǎng)絡(luò)技術(shù)(北京)有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 張萌
地址 100082 北京市海淀區(qū)中關(guān)村大街1號(hào)16層1602-39號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開(kāi)了一種文本處理方法、裝置及計(jì)算機(jī)設(shè)備,所述方法包括:將待處理文本拆分為多個(gè)分句;將所有分句輸入情感分類模型,以獲得每個(gè)分句對(duì)應(yīng)各類情感的概率;根據(jù)每個(gè)分句對(duì)應(yīng)各類情感的概率計(jì)算各分句的置信分;將置信分大于或者等于預(yù)設(shè)閾值的分句按順序拼接為整句,作為所述待處理文本的處理結(jié)果輸出。通過(guò)上述方案,將輸入的文本拆分為分句,縮短文本的同時(shí)避免了句子結(jié)構(gòu)的破壞;在對(duì)分句進(jìn)行處理時(shí),引入了置信分這一客觀數(shù)據(jù)對(duì)分句進(jìn)行篩選,而非人為的基于某種規(guī)則的選擇,更具一般性和適用性。