一種語義搜索的實(shí)現(xiàn)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202111683267.1 | 申請日 | - |
公開(公告)號 | CN114490928A | 公開(公告)日 | 2022-05-13 |
申請公布號 | CN114490928A | 申請公布日 | 2022-05-13 |
分類號 | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳開冉;黎展;黃俊強(qiáng);方燁封 | 申請(專利權(quán))人 | 廣州探跡科技有限公司 |
代理機(jī)構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | - |
地址 | 510000廣東省廣州市番禺區(qū)小谷圍街青藍(lán)街26號503 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種語義搜索的實(shí)現(xiàn)方法。包括:將待識別文本輸入第一NER模型,得到文本片段標(biāo)記序列;將片段輸入第二NER模型,得到片段實(shí)體標(biāo)記序列;使用預(yù)設(shè)分類符號和預(yù)設(shè)節(jié)點(diǎn)數(shù)據(jù)按照預(yù)設(shè)規(guī)則分別對文本片段標(biāo)記序列和片段實(shí)體標(biāo)記序列進(jìn)行格式轉(zhuǎn)換,得到文本關(guān)系樹葉節(jié)點(diǎn)序列和片段關(guān)系樹葉節(jié)點(diǎn)序列;分別輸入關(guān)系樹生成模型,得到文本父節(jié)點(diǎn)坐標(biāo)序列和片段父節(jié)點(diǎn)坐標(biāo)序列;分別生成對應(yīng)的文本關(guān)系樹結(jié)構(gòu)和片段關(guān)系樹結(jié)構(gòu);使用所述片段關(guān)系樹結(jié)構(gòu)替換所述文本關(guān)系樹結(jié)構(gòu)中所述包含實(shí)體的上下文片段對應(yīng)的葉節(jié)點(diǎn),生成語義搜索關(guān)系樹結(jié)構(gòu)。本發(fā)明能夠增強(qiáng)語義搜索的泛化性,應(yīng)對復(fù)雜查詢邏輯的魯棒性,提高長難語句的識別精度。 |
