基于關(guān)鍵詞提取和快速文本分類的發(fā)票虛抵風(fēng)險評估方法

基本信息

申請?zhí)?/td> CN202010972389.1 申請日 -
公開(公告)號 CN112182207A 公開(公告)日 2021-01-05
申請公布號 CN112182207A 申請公布日 2021-01-05
分類號 G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 金語澤;周宏立 申請(專利權(quán))人 神州數(shù)碼信息系統(tǒng)有限公司
代理機構(gòu) 北京智繪未來專利代理事務(wù)所(普通合伙) 代理人 神州數(shù)碼信息系統(tǒng)有限公司
地址 100194北京市海淀區(qū)西北旺東路10號院(東區(qū))18號樓3層101-307
法律狀態(tài) -

摘要

摘要 一種基于關(guān)鍵詞提取和快速文本分類的發(fā)票虛抵風(fēng)險評估方法,包括:步驟1,建立待評估地區(qū)增值稅發(fā)票樣本數(shù)據(jù)庫;步驟2,將相似度不小于閾值的商品編碼合并為一個商品類別,并選定設(shè)定的商品類別CA;步驟3,形成正向關(guān)鍵詞集合SET正放入詞袋模型ModelCA;步驟4,形成反向關(guān)鍵詞集合SET反,更新正向關(guān)鍵詞集合SET正,更新詞袋模型ModelCA;步驟5,獲得最終詞袋模型ModelCA;步驟6,輸入待評估地區(qū)待評估時間段內(nèi)的全量增值稅發(fā)票;步驟7,利用步驟5中的最終詞袋模型ModelCA,篩選出商品類別CA的發(fā)票,判斷購方納稅人是否將發(fā)票用于銷項稅額抵扣;步驟8,統(tǒng)計整理形成風(fēng)險企業(yè)清單和報告。與現(xiàn)有技術(shù)相比,可準確判斷發(fā)票是否為虛抵發(fā)票,快速精準定位風(fēng)險。??