一種基于語義模型的招聘簡章數(shù)據(jù)抽取方法
基本信息
申請?zhí)?/td> | CN201710686374.7 | 申請日 | - |
公開(公告)號 | CN107870966A | 公開(公告)日 | 2018-04-03 |
申請公布號 | CN107870966A | 申請公布日 | 2018-04-03 |
分類號 | G06F17/30;G06F17/27 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 何梁;王承明 | 申請(專利權(quán))人 | 成都萌想科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京七夏專利代理事務(wù)所(普通合伙) | 代理人 | 王彥麗 |
地址 | 610094 四川省成都市高新區(qū)世紀(jì)城南路599號6棟14層1402號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及計算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體的講涉及一種基于語義模型的招聘簡章數(shù)據(jù)抽取方法,包括以下幾個步驟:S1、首先對該系統(tǒng)進(jìn)行多線程和隊列的創(chuàng)建,S2、對招聘簡章進(jìn)行標(biāo)簽清洗,S3、全文遍歷取出網(wǎng)申地址的鏈接,將鏈接存入數(shù)據(jù)庫,S4、進(jìn)行其他信息提取,第一步首先對全文進(jìn)行分析,然后取出職位的關(guān)鍵詞,定位出職位的位置;第二步,取出職位與職位之間的文字,再進(jìn)行進(jìn)一步挖掘,定位第一個職位,取出它到下一段職位前的文字,取出這些詞匯,清洗入庫,S5、對疑難文章語義分詞模型進(jìn)行抽??;本發(fā)明通過將招聘信息進(jìn)行分類、標(biāo)簽清洗、數(shù)據(jù)庫分類錄入,并且進(jìn)行詞性標(biāo)注,能夠幫助人們能夠快速有效地提取出對人們自身需要的有用的信息。 |
