一種基于語(yǔ)義模型的招聘簡(jiǎn)章數(shù)據(jù)抽取方法
基本信息
申請(qǐng)?zhí)?/td> | CN201710686374.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107870966A | 公開(kāi)(公告)日 | 2018-04-03 |
申請(qǐng)公布號(hào) | CN107870966A | 申請(qǐng)公布日 | 2018-04-03 |
分類號(hào) | G06F17/30;G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 何梁;王承明 | 申請(qǐng)(專利權(quán))人 | 成都萌想科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京七夏專利代理事務(wù)所(普通合伙) | 代理人 | 王彥麗 |
地址 | 610094 四川省成都市高新區(qū)世紀(jì)城南路599號(hào)6棟14層1402號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體的講涉及一種基于語(yǔ)義模型的招聘簡(jiǎn)章數(shù)據(jù)抽取方法,包括以下幾個(gè)步驟:S1、首先對(duì)該系統(tǒng)進(jìn)行多線程和隊(duì)列的創(chuàng)建,S2、對(duì)招聘簡(jiǎn)章進(jìn)行標(biāo)簽清洗,S3、全文遍歷取出網(wǎng)申地址的鏈接,將鏈接存入數(shù)據(jù)庫(kù),S4、進(jìn)行其他信息提取,第一步首先對(duì)全文進(jìn)行分析,然后取出職位的關(guān)鍵詞,定位出職位的位置;第二步,取出職位與職位之間的文字,再進(jìn)行進(jìn)一步挖掘,定位第一個(gè)職位,取出它到下一段職位前的文字,取出這些詞匯,清洗入庫(kù),S5、對(duì)疑難文章語(yǔ)義分詞模型進(jìn)行抽?。槐景l(fā)明通過(guò)將招聘信息進(jìn)行分類、標(biāo)簽清洗、數(shù)據(jù)庫(kù)分類錄入,并且進(jìn)行詞性標(biāo)注,能夠幫助人們能夠快速有效地提取出對(duì)人們自身需要的有用的信息。 |
