一種基于語(yǔ)義模型的招聘簡(jiǎn)章數(shù)據(jù)抽取方法

基本信息

申請(qǐng)?zhí)?/td> CN201710686374.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107870966A 公開(kāi)(公告)日 2018-04-03
申請(qǐng)公布號(hào) CN107870966A 申請(qǐng)公布日 2018-04-03
分類號(hào) G06F17/30;G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 何梁;王承明 申請(qǐng)(專利權(quán))人 成都萌想科技有限責(zé)任公司
代理機(jī)構(gòu) 北京七夏專利代理事務(wù)所(普通合伙) 代理人 王彥麗
地址 610094 四川省成都市高新區(qū)世紀(jì)城南路599號(hào)6棟14層1402號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體的講涉及一種基于語(yǔ)義模型的招聘簡(jiǎn)章數(shù)據(jù)抽取方法,包括以下幾個(gè)步驟:S1、首先對(duì)該系統(tǒng)進(jìn)行多線程和隊(duì)列的創(chuàng)建,S2、對(duì)招聘簡(jiǎn)章進(jìn)行標(biāo)簽清洗,S3、全文遍歷取出網(wǎng)申地址的鏈接,將鏈接存入數(shù)據(jù)庫(kù),S4、進(jìn)行其他信息提取,第一步首先對(duì)全文進(jìn)行分析,然后取出職位的關(guān)鍵詞,定位出職位的位置;第二步,取出職位與職位之間的文字,再進(jìn)行進(jìn)一步挖掘,定位第一個(gè)職位,取出它到下一段職位前的文字,取出這些詞匯,清洗入庫(kù),S5、對(duì)疑難文章語(yǔ)義分詞模型進(jìn)行抽?。槐景l(fā)明通過(guò)將招聘信息進(jìn)行分類、標(biāo)簽清洗、數(shù)據(jù)庫(kù)分類錄入,并且進(jìn)行詞性標(biāo)注,能夠幫助人們能夠快速有效地提取出對(duì)人們自身需要的有用的信息。