一種流水文件識別方法、裝置及計算機存儲介質(zhì)、電子設(shè)備
基本信息
申請?zhí)?/td> | CN201910846422.3 | 申請日 | - |
公開(公告)號 | CN110728142A | 公開(公告)日 | 2020-01-24 |
申請公布號 | CN110728142A | 申請公布日 | 2020-01-24 |
分類號 | G06F40/289;G06F40/30;G06Q10/10;G06Q40/02 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 龔偉松;范志海;徐毅;李高鋒;張慧霞 | 申請(專利權(quán))人 | 上海凱京信達科技集團有限公司 |
代理機構(gòu) | 北京新知遠方知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 上海凱京信達科技集團有限公司 |
地址 | 200333 上海市普陀區(qū)大渡河路1718號C區(qū)308-1室 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種流水文件識別方法、裝置及計算機存儲介質(zhì)、電子設(shè)備,包括:確定待識別的文件;提取所述文件的字段;將每個字段進行分詞得到多個詞語;根據(jù)預(yù)先構(gòu)建的語義空間將所述文件的每個詞語向量化,生成字段向量;將所述字段向量與所述預(yù)先構(gòu)建的語義空間中的每個向量進行匹配,得到每個字段的相關(guān)系數(shù);在相關(guān)系數(shù)超過預(yù)設(shè)系數(shù)閾值的字段數(shù)量滿足第一預(yù)設(shè)范圍時,確定所述待識別的文件為流水文件。采用本申請中的方案,可以通過對待識別的文件進行字段提取、分詞以及向量化處理,再結(jié)合預(yù)先構(gòu)建的語義空間進行向量匹配,從而實現(xiàn)自動識別出各種流水文件、非流水文件,進而可以幫助信審和業(yè)務(wù)人員減少手動處理流水的時間,提高信審效率。 |
