基于地址樹模型的中文地址提取方法

基本信息

申請?zhí)?/td> CN202010216951.8 申請日 -
公開(公告)號 CN111444299A 公開(公告)日 2020-07-24
申請公布號 CN111444299A 申請公布日 2020-07-24
分類號 G06F16/29(2019.01)I 分類 -
發(fā)明人 張平;亢孟軍;汪艷霞;葉蕾;劉越;曾偉東;陳建;黃磊;劉仁;林熹 申請(專利權(quán))人 福州市勘測院有限公司
代理機構(gòu) 福州元創(chuàng)專利商標(biāo)代理有限公司 代理人 丘鴻超;蔡學(xué)俊
地址 350108福建省福州市閩侯縣上街鎮(zhèn)高新大道1號
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種基于地址樹模型的中文地址提取方法,包括以下步驟:步驟S1:對地址字符串進行分詞和識別,生成地址元素集合以及地址元素語義集合;步驟S2:建立根結(jié)點root,提取地址元素,遍歷地址元素的語義集,構(gòu)建地址語義結(jié)點,并依次連結(jié)到根節(jié)點;步驟S3:提取后續(xù)地址元素,遍歷其語義結(jié)點;執(zhí)行語義級別的比較和空間約束關(guān)系一致性判斷,進行與葉子節(jié)點的連接或生成新的子樹。??