一種流水文件識(shí)別方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)、電子設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN201910846422.3 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110728142A | 公開(公告)日 | 2020-01-24 |
申請(qǐng)公布號(hào) | CN110728142A | 申請(qǐng)公布日 | 2020-01-24 |
分類號(hào) | G06F40/289;G06F40/30;G06Q10/10;G06Q40/02 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 龔偉松;范志海;徐毅;李高鋒;張慧霞 | 申請(qǐng)(專利權(quán))人 | 上海斑馬來拉物流科技有限公司 |
代理機(jī)構(gòu) | 北京新知遠(yuǎn)方知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 上海凱京信達(dá)科技集團(tuán)有限公司 |
地址 | 200333 上海市普陀區(qū)大渡河路1718號(hào)C區(qū)308-1室 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種流水文件識(shí)別方法、裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)、電子設(shè)備,包括:確定待識(shí)別的文件;提取所述文件的字段;將每個(gè)字段進(jìn)行分詞得到多個(gè)詞語;根據(jù)預(yù)先構(gòu)建的語義空間將所述文件的每個(gè)詞語向量化,生成字段向量;將所述字段向量與所述預(yù)先構(gòu)建的語義空間中的每個(gè)向量進(jìn)行匹配,得到每個(gè)字段的相關(guān)系數(shù);在相關(guān)系數(shù)超過預(yù)設(shè)系數(shù)閾值的字段數(shù)量滿足第一預(yù)設(shè)范圍時(shí),確定所述待識(shí)別的文件為流水文件。采用本申請(qǐng)中的方案,可以通過對(duì)待識(shí)別的文件進(jìn)行字段提取、分詞以及向量化處理,再結(jié)合預(yù)先構(gòu)建的語義空間進(jìn)行向量匹配,從而實(shí)現(xiàn)自動(dòng)識(shí)別出各種流水文件、非流水文件,進(jìn)而可以幫助信審和業(yè)務(wù)人員減少手動(dòng)處理流水的時(shí)間,提高信審效率。 |
