一種垃圾文本識別方法和裝置

基本信息

申請?zhí)?/td> CN201710273503.X 申請日 -
公開(公告)號 CN107239440B 公開(公告)日 2021-05-25
申請公布號 CN107239440B 申請公布日 2021-05-25
分類號 G06F40/279(2020.01)I;G06F16/9535(2019.01)I;G06F40/30(2020.01)I;G06F40/289(2020.01)I 分類 -
發(fā)明人 斯義譜;鄭侃侃 申請(專利權)人 杭州博盾習言科技有限公司
代理機構(gòu) 北京潤澤恒知識產(chǎn)權代理有限公司 代理人 蘇培華
地址 310000 浙江省杭州市余杭區(qū)五常街道文一西路998號18幢704室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供了一種垃圾文本識別方法和系統(tǒng),該方法和系統(tǒng)應用于互聯(lián)網(wǎng),具體為獲取互聯(lián)網(wǎng)的用戶輸入的文本;對文本的特征進行特征提取,得到文本的多個文本特征;利用預設的垃圾文本識別模型對用戶輸入的文本進行識別,得到文本的垃圾概率。通過用戶輸入的文本的垃圾概率和一定的預設標準可以確定出該文本是否為垃圾文本,并可進一步對判定的垃圾文本采取一定的預防措施,從而能夠避免垃圾文本對互聯(lián)網(wǎng)的健康發(fā)展帶來不利影響。??