基于機(jī)器學(xué)習(xí)的簡(jiǎn)歷文檔判別方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201910234751.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN109992778A | 公開(kāi)(公告)日 | 2019-07-09 |
申請(qǐng)公布號(hào) | CN109992778A | 申請(qǐng)公布日 | 2019-07-09 |
分類號(hào) | G06F17/27(2006.01)I; G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 黃威威; 沈劍 | 申請(qǐng)(專利權(quán))人 | 深圳八爪網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 深圳市精英專利事務(wù)所 | 代理人 | 深圳八爪網(wǎng)絡(luò)科技有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)白石路3609號(hào)深圳灣科技生態(tài)園二區(qū)9棟B801-802 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于機(jī)器學(xué)習(xí)的簡(jiǎn)歷文檔判別方法及裝置,其中,所述基于機(jī)器學(xué)習(xí)的簡(jiǎn)歷文檔判別方法,包括:對(duì)導(dǎo)入文檔進(jìn)行預(yù)處理,得到導(dǎo)入文本;抽取預(yù)處理導(dǎo)入文本中的關(guān)鍵詞特征以及導(dǎo)入文本順序特征,并將關(guān)鍵詞特征以及導(dǎo)入文本順序特征分別轉(zhuǎn)化為數(shù)值向量并確定導(dǎo)入文本的文本特征向量;根據(jù)構(gòu)建的預(yù)測(cè)模型對(duì)文本特征向量進(jìn)行預(yù)測(cè),得到對(duì)應(yīng)的置信度;根據(jù)置信度對(duì)導(dǎo)入文本進(jìn)行判別,如果置信度大于設(shè)定閾值,則表示導(dǎo)入文本為簡(jiǎn)歷文檔。本發(fā)明的技術(shù)方案能夠在保護(hù)用戶隱私信息前提下,高效快速準(zhǔn)確的篩選出簡(jiǎn)歷文檔,從而提高用戶體驗(yàn)。 |
