一種基于語義模型的招聘簡章數(shù)據(jù)抽取方法

基本信息

申請?zhí)?/td> CN201710686374.7 申請日 -
公開(公告)號 CN107870966A 公開(公告)日 2018-04-03
申請公布號 CN107870966A 申請公布日 2018-04-03
分類號 G06F17/30;G06F17/27 分類 計算;推算;計數(shù);
發(fā)明人 何梁;王承明 申請(專利權(quán))人 成都萌想科技有限責(zé)任公司
代理機(jī)構(gòu) 北京七夏專利代理事務(wù)所(普通合伙) 代理人 王彥麗
地址 610094 四川省成都市高新區(qū)世紀(jì)城南路599號6棟14層1402號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及計算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體的講涉及一種基于語義模型的招聘簡章數(shù)據(jù)抽取方法,包括以下幾個步驟:S1、首先對該系統(tǒng)進(jìn)行多線程和隊列的創(chuàng)建,S2、對招聘簡章進(jìn)行標(biāo)簽清洗,S3、全文遍歷取出網(wǎng)申地址的鏈接,將鏈接存入數(shù)據(jù)庫,S4、進(jìn)行其他信息提取,第一步首先對全文進(jìn)行分析,然后取出職位的關(guān)鍵詞,定位出職位的位置;第二步,取出職位與職位之間的文字,再進(jìn)行進(jìn)一步挖掘,定位第一個職位,取出它到下一段職位前的文字,取出這些詞匯,清洗入庫,S5、對疑難文章語義分詞模型進(jìn)行抽??;本發(fā)明通過將招聘信息進(jìn)行分類、標(biāo)簽清洗、數(shù)據(jù)庫分類錄入,并且進(jìn)行詞性標(biāo)注,能夠幫助人們能夠快速有效地提取出對人們自身需要的有用的信息。