一種國際貿(mào)易文件處理方法、系統(tǒng)以及一種服務(wù)器

基本信息

申請?zhí)?/td> CN201710564744.X 申請日 -
公開(公告)號 CN108170697A 公開(公告)日 2018-06-15
申請公布號 CN108170697A 申請公布日 2018-06-15
分類號 G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 俞洲;吳思琪 申請(專利權(quán))人 信號旗智能科技(上海)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 200942 上海市浦東新區(qū)寶山區(qū)蕰川路6號B區(qū)1075室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種國際貿(mào)易文件處理方法、系統(tǒng)以及一種服務(wù)器,所述方法包括:對圖像國際貿(mào)易文件和文檔國際貿(mào)易文件進(jìn)行分類;識別圖像國際貿(mào)易文件并將識別后的圖像國際貿(mào)易文件和文檔國際貿(mào)易文件統(tǒng)一轉(zhuǎn)換為XML文件;根據(jù)XML文件附帶的文件特征對XML文件進(jìn)行分類;對XML文件進(jìn)行分析處理確定XML文件中結(jié)構(gòu)化部分和非結(jié)構(gòu)化部分;對非結(jié)構(gòu)化部分中的內(nèi)容進(jìn)行邊界判別,確定標(biāo)題區(qū)域和內(nèi)容區(qū)域;對結(jié)構(gòu)化部分有線框則依據(jù)線框,無線框則進(jìn)行自適應(yīng)投影;利用最大熵模型進(jìn)行命名實(shí)體識別、根據(jù)規(guī)則判斷句尾和基于本體表格的關(guān)系數(shù)據(jù)抽取,并將國際貿(mào)易信息元素以結(jié)構(gòu)體的形式存儲。所以本發(fā)明可完成國際貿(mào)易文件的結(jié)構(gòu)化存儲。