一種面向自然語言搜索結(jié)構(gòu)化數(shù)據(jù)的詞義積累及分詞方法、工具和系統(tǒng)

基本信息

申請?zhí)?/td> CN201911372759.1 申請日 -
公開(公告)號 CN113051898A 公開(公告)日 2021-06-29
申請公布號 CN113051898A 申請公布日 2021-06-29
分類號 G06F40/247;G06F40/295;G06F16/332;G06F16/36 分類 計算;推算;計數(shù);
發(fā)明人 余宙;楊永智;陳文佳 申請(專利權(quán))人 北京阿博茨科技有限公司
代理機構(gòu) 國浩律師(南京)事務(wù)所 代理人 孟睿;孔劍凡
地址 100194 北京市海淀區(qū)蘇家坨鎮(zhèn)西小營南環(huán)10號院1幢1115號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種面向自然語言搜索結(jié)構(gòu)化數(shù)據(jù)的詞義積累及分詞方法、工具和系統(tǒng)。在配置庫中定義虛擬維度數(shù)據(jù),并更新詞典;在配置庫中,每一類實體各有一張?zhí)摂M維度表,所述虛擬維度表包含實體名稱列和維度列,在所述虛擬維度表中定義虛擬維度數(shù)據(jù);在搜索結(jié)構(gòu)化數(shù)據(jù)過程中,對用戶輸入的自然語言,先使用個人詞典分詞,對個人詞典未識別出的詞,再使用系統(tǒng)詞典進行分詞,從而將用戶輸入的自然語言轉(zhuǎn)譯為數(shù)據(jù)庫查詢語言;當超過N個個人字典將對同一個詞定義了相同的詞義,則將該詞的詞義從人字典同步至系統(tǒng)詞典。本發(fā)明詞義積累準確、快速。