一種面向自然語言搜索結(jié)構(gòu)化數(shù)據(jù)的詞義積累及分詞方法、工具和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201911372759.1 | 申請日 | - |
公開(公告)號 | CN113051898A | 公開(公告)日 | 2021-06-29 |
申請公布號 | CN113051898A | 申請公布日 | 2021-06-29 |
分類號 | G06F40/247;G06F40/295;G06F16/332;G06F16/36 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 余宙;楊永智;陳文佳 | 申請(專利權(quán))人 | 北京阿博茨科技有限公司 |
代理機構(gòu) | 國浩律師(南京)事務(wù)所 | 代理人 | 孟睿;孔劍凡 |
地址 | 100194 北京市海淀區(qū)蘇家坨鎮(zhèn)西小營南環(huán)10號院1幢1115號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種面向自然語言搜索結(jié)構(gòu)化數(shù)據(jù)的詞義積累及分詞方法、工具和系統(tǒng)。在配置庫中定義虛擬維度數(shù)據(jù),并更新詞典;在配置庫中,每一類實體各有一張?zhí)摂M維度表,所述虛擬維度表包含實體名稱列和維度列,在所述虛擬維度表中定義虛擬維度數(shù)據(jù);在搜索結(jié)構(gòu)化數(shù)據(jù)過程中,對用戶輸入的自然語言,先使用個人詞典分詞,對個人詞典未識別出的詞,再使用系統(tǒng)詞典進行分詞,從而將用戶輸入的自然語言轉(zhuǎn)譯為數(shù)據(jù)庫查詢語言;當超過N個個人字典將對同一個詞定義了相同的詞義,則將該詞的詞義從人字典同步至系統(tǒng)詞典。本發(fā)明詞義積累準確、快速。 |
