基于語(yǔ)義分析的短信犯罪識(shí)別方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201910798793.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN110633466A | 公開(kāi)(公告)日 | 2019-12-31 |
申請(qǐng)公布號(hào) | CN110633466A | 申請(qǐng)公布日 | 2019-12-31 |
分類(lèi)號(hào) | G06F17/27(2006.01); G06F16/35(2019.01); G06N3/04(2006.01); G06N3/08(2006.01) | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 高磊; 肖安鵬 | 申請(qǐng)(專(zhuān)利權(quán))人 | 深圳安巽科技有限公司 |
代理機(jī)構(gòu) | 深圳市恒程創(chuàng)新知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 深圳安巽科技有限公司 |
地址 | 518000 廣東省深圳市福田區(qū)梅林街道梅都社區(qū)梅林路48號(hào)卓越梅林中心廣場(chǎng)(南區(qū))卓悅匯A1306 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)基于語(yǔ)義分析的短信犯罪識(shí)別方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì),其中,短信犯罪識(shí)別方法包括:以文本概念為維,建立文本語(yǔ)義表示空間;根據(jù)所述文本語(yǔ)義表示空間,對(duì)輸入的各種短信犯罪類(lèi)型的樣本短信數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),得到每種所述短信犯罪類(lèi)型對(duì)應(yīng)的語(yǔ)義特征和黑白樣本;根據(jù)所述語(yǔ)義特征和黑白樣本,研判真實(shí)短信數(shù)據(jù)是否為犯罪短信數(shù)據(jù);若判定所述真實(shí)短信數(shù)據(jù)為犯罪短信數(shù)據(jù),則輸出研判結(jié)果信息。本發(fā)明的技術(shù)方案能解決現(xiàn)有技術(shù)中以字詞為基本特征進(jìn)行文本分類(lèi)的方法在對(duì)短信內(nèi)容進(jìn)行分析時(shí),難以真實(shí)重現(xiàn)短信文本信息,還原短信真實(shí)語(yǔ)義,進(jìn)而難以準(zhǔn)確識(shí)別短信犯罪的問(wèn)題。 |
