基于機器學(xué)習(xí)的招聘信息解析系統(tǒng)及其方法

基本信息

申請?zhí)?/td> CN201610251667.8 申請日 -
公開(公告)號 CN105868968A 公開(公告)日 2016-08-17
申請公布號 CN105868968A 申請公布日 2016-08-17
分類號 G06Q10/10(2012.01)I;G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 楊洋;楊雪峰;趙泛舟;李訓(xùn)耕 申請(專利權(quán))人 廣州愛拼信息科技有限公司
代理機構(gòu) - 代理人 -
地址 510000 廣東省廣州市天河區(qū)華夏路26號12樓全層房自編D13房
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基于機器學(xué)習(xí)的招聘信息解析系統(tǒng)及其方法,解析系統(tǒng)包括數(shù)據(jù)采集模型和機器學(xué)習(xí)模型;所述數(shù)據(jù)采集模型爬取互聯(lián)網(wǎng)招聘網(wǎng)站的不規(guī)則的招聘網(wǎng)頁信息進行解析并生成訓(xùn)練數(shù)據(jù);機器學(xué)習(xí)模型包括單信息源模型以及處理各類信息源的綜合模型,單信息源模型是由訓(xùn)練數(shù)據(jù)中的單信息源模塊分類數(shù)據(jù)訓(xùn)練所得,綜合模型是由訓(xùn)練數(shù)據(jù)中的綜合信息詳細(xì)分類數(shù)據(jù)訓(xùn)練所得,互聯(lián)網(wǎng)招聘網(wǎng)站、數(shù)據(jù)采集模型與機器學(xué)習(xí)模型連接,所采用的機器學(xué)習(xí)模型為條件隨機場模型。招聘網(wǎng)頁信息經(jīng)過分析后得到訓(xùn)練數(shù)據(jù)后詳細(xì)分類,采用機器學(xué)習(xí)模型中的條件隨機場模型來對招聘信息中的具體語句塊與短語進行分類標(biāo)注,處理正則表達(dá)式不能匹配的數(shù)據(jù),有效處理復(fù)雜或者新型職位的招聘信息解析與分析問題。