基于地址樹模型的中文地址提取方法

基本信息

申請(qǐng)?zhí)?/td> CN202010216951.8 申請(qǐng)日 -
公開(公告)號(hào) CN111444299A 公開(公告)日 2020-07-24
申請(qǐng)公布號(hào) CN111444299A 申請(qǐng)公布日 2020-07-24
分類號(hào) G06F16/29(2019.01)I 分類 -
發(fā)明人 張平;亢孟軍;汪艷霞;葉蕾;劉越;曾偉東;陳建;黃磊;劉仁;林熹 申請(qǐng)(專利權(quán))人 福州市勘測院有限公司
代理機(jī)構(gòu) 福州元?jiǎng)?chuàng)專利商標(biāo)代理有限公司 代理人 丘鴻超;蔡學(xué)俊
地址 350108福建省福州市閩侯縣上街鎮(zhèn)高新大道1號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種基于地址樹模型的中文地址提取方法,包括以下步驟:步驟S1:對(duì)地址字符串進(jìn)行分詞和識(shí)別,生成地址元素集合以及地址元素語義集合;步驟S2:建立根結(jié)點(diǎn)root,提取地址元素,遍歷地址元素的語義集,構(gòu)建地址語義結(jié)點(diǎn),并依次連結(jié)到根節(jié)點(diǎn);步驟S3:提取后續(xù)地址元素,遍歷其語義結(jié)點(diǎn);執(zhí)行語義級(jí)別的比較和空間約束關(guān)系一致性判斷,進(jìn)行與葉子節(jié)點(diǎn)的連接或生成新的子樹。??