一種基于聚類的員工行為分類模型數(shù)據(jù)集的生成方法

基本信息

申請(qǐng)?zhí)?/td> CN202011208317.6 申請(qǐng)日 -
公開(公告)號(hào) CN112330139A 公開(公告)日 2021-02-05
申請(qǐng)公布號(hào) CN112330139A 申請(qǐng)公布日 2021-02-05
分類號(hào) G06Q10/06(2012.01)I; 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 于振坤;胡豫隴;馮森;譚健;王雪蓮 申請(qǐng)(專利權(quán))人 北京方云科技有限公司
代理機(jī)構(gòu) 北京正理專利代理有限公司 代理人 付生輝
地址 100086北京市海淀區(qū)知春路113號(hào)0706-179
法律狀態(tài) -

摘要

摘要 本發(fā)明一個(gè)實(shí)施例公開一種基于聚類的員工行為分類模型數(shù)據(jù)集、模型訓(xùn)練方法和應(yīng)用,包括:S10、獲取員工在時(shí)間周期內(nèi)的時(shí)間序列數(shù)據(jù),計(jì)算RFM變量,得出員工的R、F和M,其中R為員工有價(jià)值產(chǎn)出最近一次的時(shí)間點(diǎn),F(xiàn)為時(shí)間周期內(nèi),員工價(jià)值產(chǎn)出頻率,M為時(shí)間周期內(nèi)平均價(jià)值產(chǎn)出;S20、獲取員工在時(shí)間周期內(nèi)的截面數(shù)據(jù),計(jì)算在時(shí)間周期內(nèi)的實(shí)際工作總時(shí)長(zhǎng)、已完成開發(fā)任務(wù)數(shù)量、缺陷數(shù)量、缺陷處理總時(shí)長(zhǎng)和組織成本五個(gè)截面特征變量;S30、將R、F和M和五個(gè)截面特征變量合并,得到員工的八個(gè)特征變量;S40、檢驗(yàn)八個(gè)特征變量間的相關(guān)性,去除關(guān)聯(lián)變量,得到用于聚類的特征變量,并將時(shí)間周期內(nèi)的用于聚類的特征變量作為數(shù)據(jù)集。??