基于語義分析的短信犯罪識別方法、系統(tǒng)和可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201910798793.9 申請日 -
公開(公告)號 CN110633466A 公開(公告)日 2019-12-31
申請公布號 CN110633466A 申請公布日 2019-12-31
分類號 G06F17/27(2006.01); G06F16/35(2019.01); G06N3/04(2006.01); G06N3/08(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 高磊; 肖安鵬 申請(專利權(quán))人 深圳安巽科技有限公司
代理機構(gòu) 深圳市恒程創(chuàng)新知識產(chǎn)權(quán)代理有限公司 代理人 深圳安巽科技有限公司
地址 518000 廣東省深圳市福田區(qū)梅林街道梅都社區(qū)梅林路48號卓越梅林中心廣場(南區(qū))卓悅匯A1306
法律狀態(tài) -

摘要

摘要 本發(fā)明公開基于語義分析的短信犯罪識別方法、系統(tǒng)和可讀存儲介質(zhì),其中,短信犯罪識別方法包括:以文本概念為維,建立文本語義表示空間;根據(jù)所述文本語義表示空間,對輸入的各種短信犯罪類型的樣本短信數(shù)據(jù)進行機器學習,得到每種所述短信犯罪類型對應的語義特征和黑白樣本;根據(jù)所述語義特征和黑白樣本,研判真實短信數(shù)據(jù)是否為犯罪短信數(shù)據(jù);若判定所述真實短信數(shù)據(jù)為犯罪短信數(shù)據(jù),則輸出研判結(jié)果信息。本發(fā)明的技術(shù)方案能解決現(xiàn)有技術(shù)中以字詞為基本特征進行文本分類的方法在對短信內(nèi)容進行分析時,難以真實重現(xiàn)短信文本信息,還原短信真實語義,進而難以準確識別短信犯罪的問題。