基于迭代擴樣的財務(wù)粉飾與異常識別模型構(gòu)建方法

基本信息

申請?zhí)?/td> CN202110363136.9 申請日 -
公開(公告)號 CN113065949A 公開(公告)日 2021-07-02
申請公布號 CN113065949A 申請公布日 2021-07-02
分類號 G06Q40/02;G06K9/62;G06N3/00 分類 計算;推算;計數(shù);
發(fā)明人 張洪江;李巖;宋兵;朱啟功 申請(專利權(quán))人 河北雄安舜耕數(shù)據(jù)科技有限公司
代理機構(gòu) 上海新隆知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉蘭英
地址 071700 河北省保定市容城縣白洋淀大道錦泰花園A區(qū)1號樓3單元502室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于迭代擴樣的財務(wù)粉飾與異常識別模型構(gòu)建方法,屬于對公信貸過程中的反欺詐、風(fēng)控的領(lǐng)域,其包括以下步驟:從全部樣本中選取原始異常樣本和正常樣本并確定分層變量,對正常樣本進行抽樣配比得到初始樣本;根據(jù)初始樣本,設(shè)定樣本特征變量,利用隨機森林算法建立標(biāo)準(zhǔn)分類模型作為基礎(chǔ)分類模型;利用基礎(chǔ)分類模型對全部樣本進行預(yù)測;根據(jù)預(yù)測結(jié)果得到半監(jiān)督迭代擴充樣本和業(yè)務(wù)邏輯擴充樣本;將半監(jiān)督迭代擴充樣本、業(yè)務(wù)邏輯擴充樣本與原始異常樣本混合后對正常樣本進行抽樣配比得到最終訓(xùn)練樣本,進行訓(xùn)練得到最終財務(wù)粉飾與異常識別模型。本發(fā)明能夠解決在傳統(tǒng)建模過程中因正負(fù)樣本不均衡引起的模型表現(xiàn)欠佳或普適性不高的問題。