基于語(yǔ)義分析的短信犯罪識(shí)別方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201910798793.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110633466B | 公開(公告)日 | 2019-12-31 |
申請(qǐng)公布號(hào) | CN110633466B | 申請(qǐng)公布日 | 2019-12-31 |
分類號(hào) | G06F40/30(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 高磊;肖安鵬 | 申請(qǐng)(專利權(quán))人 | 深圳安巽科技有限公司 |
代理機(jī)構(gòu) | 深圳市恒程創(chuàng)新知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 深圳安巽科技有限公司 |
地址 | 518000廣東省深圳市福田區(qū)梅林街道梅都社區(qū)梅林路48號(hào)卓越梅林中心廣場(chǎng)(南區(qū))卓悅匯A1306 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開基于語(yǔ)義分析的短信犯罪識(shí)別方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì),其中,短信犯罪識(shí)別方法包括:以文本概念為維,建立文本語(yǔ)義表示空間;根據(jù)所述文本語(yǔ)義表示空間,對(duì)輸入的各種短信犯罪類型的樣本短信數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),得到每種所述短信犯罪類型對(duì)應(yīng)的語(yǔ)義特征和黑白樣本;根據(jù)所述語(yǔ)義特征和黑白樣本,研判真實(shí)短信數(shù)據(jù)是否為犯罪短信數(shù)據(jù);若判定所述真實(shí)短信數(shù)據(jù)為犯罪短信數(shù)據(jù),則輸出研判結(jié)果信息。本發(fā)明的技術(shù)方案能解決現(xiàn)有技術(shù)中以字詞為基本特征進(jìn)行文本分類的方法在對(duì)短信內(nèi)容進(jìn)行分析時(shí),難以真實(shí)重現(xiàn)短信文本信息,還原短信真實(shí)語(yǔ)義,進(jìn)而難以準(zhǔn)確識(shí)別短信犯罪的問(wèn)題。?? |
