文本處理方法、裝置及計(jì)算機(jī)設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202110144807.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112800747A | 公開(kāi)(公告)日 | 2021-05-14 |
申請(qǐng)公布號(hào) | CN112800747A | 申請(qǐng)公布日 | 2021-05-14 |
分類號(hào) | G06F40/211;G06F16/35;G06F40/44;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 胡韜;熊軍;張繼晟 | 申請(qǐng)(專利權(quán))人 | 虎博網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 張萌 |
地址 | 100082 北京市海淀區(qū)中關(guān)村大街1號(hào)16層1602-39號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例公開(kāi)了一種文本處理方法、裝置及計(jì)算機(jī)設(shè)備,所述方法包括:將待處理文本拆分為多個(gè)分句;將所有分句輸入情感分類模型,以獲得每個(gè)分句對(duì)應(yīng)各類情感的概率;根據(jù)每個(gè)分句對(duì)應(yīng)各類情感的概率計(jì)算各分句的置信分;將置信分大于或者等于預(yù)設(shè)閾值的分句按順序拼接為整句,作為所述待處理文本的處理結(jié)果輸出。通過(guò)上述方案,將輸入的文本拆分為分句,縮短文本的同時(shí)避免了句子結(jié)構(gòu)的破壞;在對(duì)分句進(jìn)行處理時(shí),引入了置信分這一客觀數(shù)據(jù)對(duì)分句進(jìn)行篩選,而非人為的基于某種規(guī)則的選擇,更具一般性和適用性。 |
