一種國際貿易文件處理方法、系統(tǒng)以及一種服務器
基本信息
申請?zhí)?/td> | CN201710564744.X | 申請日 | - |
公開(公告)號 | CN108170697A | 公開(公告)日 | 2018-06-15 |
申請公布號 | CN108170697A | 申請公布日 | 2018-06-15 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數; |
發(fā)明人 | 俞洲;吳思琪 | 申請(專利權)人 | 信號旗智能科技(上海)有限公司 |
代理機構 | - | 代理人 | - |
地址 | 200942 上海市浦東新區(qū)寶山區(qū)蕰川路6號B區(qū)1075室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種國際貿易文件處理方法、系統(tǒng)以及一種服務器,所述方法包括:對圖像國際貿易文件和文檔國際貿易文件進行分類;識別圖像國際貿易文件并將識別后的圖像國際貿易文件和文檔國際貿易文件統(tǒng)一轉換為XML文件;根據XML文件附帶的文件特征對XML文件進行分類;對XML文件進行分析處理確定XML文件中結構化部分和非結構化部分;對非結構化部分中的內容進行邊界判別,確定標題區(qū)域和內容區(qū)域;對結構化部分有線框則依據線框,無線框則進行自適應投影;利用最大熵模型進行命名實體識別、根據規(guī)則判斷句尾和基于本體表格的關系數據抽取,并將國際貿易信息元素以結構體的形式存儲。所以本發(fā)明可完成國際貿易文件的結構化存儲。 |
