一種流水文件識別方法、裝置及計算機存儲介質(zhì)、電子設(shè)備

基本信息

申請?zhí)?/td> CN201910846422.3 申請日 -
公開(公告)號 CN110728142A 公開(公告)日 2020-01-24
申請公布號 CN110728142A 申請公布日 2020-01-24
分類號 G06F40/289;G06F40/30;G06Q10/10;G06Q40/02 分類 計算;推算;計數(shù);
發(fā)明人 龔偉松;范志海;徐毅;李高鋒;張慧霞 申請(專利權(quán))人 上海凱京信達科技集團有限公司
代理機構(gòu) 北京新知遠方知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 上海凱京信達科技集團有限公司
地址 200333 上海市普陀區(qū)大渡河路1718號C區(qū)308-1室
法律狀態(tài) -

摘要

摘要 一種流水文件識別方法、裝置及計算機存儲介質(zhì)、電子設(shè)備,包括:確定待識別的文件;提取所述文件的字段;將每個字段進行分詞得到多個詞語;根據(jù)預(yù)先構(gòu)建的語義空間將所述文件的每個詞語向量化,生成字段向量;將所述字段向量與所述預(yù)先構(gòu)建的語義空間中的每個向量進行匹配,得到每個字段的相關(guān)系數(shù);在相關(guān)系數(shù)超過預(yù)設(shè)系數(shù)閾值的字段數(shù)量滿足第一預(yù)設(shè)范圍時,確定所述待識別的文件為流水文件。采用本申請中的方案,可以通過對待識別的文件進行字段提取、分詞以及向量化處理,再結(jié)合預(yù)先構(gòu)建的語義空間進行向量匹配,從而實現(xiàn)自動識別出各種流水文件、非流水文件,進而可以幫助信審和業(yè)務(wù)人員減少手動處理流水的時間,提高信審效率。