一種語義搜索的實(shí)現(xiàn)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202111683267.1 申請日 -
公開(公告)號 CN114490928A 公開(公告)日 2022-05-13
申請公布號 CN114490928A 申請公布日 2022-05-13
分類號 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳開冉;黎展;黃俊強(qiáng);方燁封 申請(專利權(quán))人 廣州探跡科技有限公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 -
地址 510000廣東省廣州市番禺區(qū)小谷圍街青藍(lán)街26號503
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語義搜索的實(shí)現(xiàn)方法。包括:將待識別文本輸入第一NER模型,得到文本片段標(biāo)記序列;將片段輸入第二NER模型,得到片段實(shí)體標(biāo)記序列;使用預(yù)設(shè)分類符號和預(yù)設(shè)節(jié)點(diǎn)數(shù)據(jù)按照預(yù)設(shè)規(guī)則分別對文本片段標(biāo)記序列和片段實(shí)體標(biāo)記序列進(jìn)行格式轉(zhuǎn)換,得到文本關(guān)系樹葉節(jié)點(diǎn)序列和片段關(guān)系樹葉節(jié)點(diǎn)序列;分別輸入關(guān)系樹生成模型,得到文本父節(jié)點(diǎn)坐標(biāo)序列和片段父節(jié)點(diǎn)坐標(biāo)序列;分別生成對應(yīng)的文本關(guān)系樹結(jié)構(gòu)和片段關(guān)系樹結(jié)構(gòu);使用所述片段關(guān)系樹結(jié)構(gòu)替換所述文本關(guān)系樹結(jié)構(gòu)中所述包含實(shí)體的上下文片段對應(yīng)的葉節(jié)點(diǎn),生成語義搜索關(guān)系樹結(jié)構(gòu)。本發(fā)明能夠增強(qiáng)語義搜索的泛化性,應(yīng)對復(fù)雜查詢邏輯的魯棒性,提高長難語句的識別精度。