簡(jiǎn)歷信息處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111115155.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113806544A | 公開(公告)日 | 2021-12-17 |
申請(qǐng)公布號(hào) | CN113806544A | 申請(qǐng)公布日 | 2021-12-17 |
分類號(hào) | G06F16/35;G06K9/62;G06Q10/10 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 時(shí)寶旭;郭瑋;莫海江 | 申請(qǐng)(專利權(quán))人 | 湖北天天數(shù)鏈技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 衡滔 |
地址 | 430205 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)武漢花城大道8號(hào)武漢軟件新城二期一組團(tuán)B10棟4層01號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┮环N簡(jiǎn)歷信息處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。方法包括:基于預(yù)處理算法對(duì)獲取的多份第一簡(jiǎn)歷信息進(jìn)行預(yù)處理,得到預(yù)處理后的多份第二簡(jiǎn)歷信息;對(duì)多份第二簡(jiǎn)歷信息中的每份第二簡(jiǎn)歷信息中的文本數(shù)據(jù)進(jìn)行數(shù)字化編碼;從得到經(jīng)過(guò)編碼的數(shù)據(jù)集中,選取核心點(diǎn),并確定核心點(diǎn)與其他點(diǎn)之間的特征距離,其他點(diǎn)指數(shù)據(jù)集中除去核心點(diǎn)之外的數(shù)據(jù);從其他點(diǎn)中選取與核心點(diǎn)對(duì)應(yīng)的聚類候選點(diǎn);將聚類候選點(diǎn)、指定數(shù)量及預(yù)設(shè)距離范圍,輸入預(yù)設(shè)聚類模型進(jìn)行迭代訓(xùn)練,得到用于對(duì)簡(jiǎn)歷信息分類的目標(biāo)聚類模型。如此,無(wú)需對(duì)用于訓(xùn)練的簡(jiǎn)歷信息設(shè)置標(biāo)簽,有利于縮短模型訓(xùn)練的時(shí)長(zhǎng),提高模型訓(xùn)練的效率,降低人力成本。 |
