一種基于語(yǔ)義理解的智能全文檢索方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110281426.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112883165A 公開(kāi)(公告)日 2021-06-01
申請(qǐng)公布號(hào) CN112883165A 申請(qǐng)公布日 2021-06-01
分類(lèi)號(hào) G06F16/33;G06F40/211;G06F40/289;G06F40/30 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳士偉;楊春;李慧娟;孫露;孫浩;辛國(guó)茂;胡傳會(huì) 申請(qǐng)(專(zhuān)利權(quán))人 山東億云信息技術(shù)有限公司
代理機(jī)構(gòu) 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 董雪
地址 250014 山東省濟(jì)南市高新區(qū)新濼大街2008號(hào)銀荷大廈B座3層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于語(yǔ)義理解的智能全文檢索方法及系統(tǒng),包括:將接收到的搜索語(yǔ)句切割為短文本,對(duì)短文本進(jìn)行分詞操作,得到短文本對(duì)應(yīng)的分詞庫(kù);構(gòu)建短文本的語(yǔ)義信息向量和依存關(guān)系向量;所述語(yǔ)義信息向量包括短文本的中心詞和詞義共現(xiàn)詞;基于短文本的語(yǔ)義信息向量和依存關(guān)系向量,將短文本信息與智能索引庫(kù)中的相關(guān)信息進(jìn)行相似度計(jì)算,進(jìn)而得到搜索結(jié)果集。本發(fā)明通過(guò)將原始數(shù)據(jù)拆分為多個(gè)短文本,形成搜索文本向量,通過(guò)調(diào)用人工智能平臺(tái)的語(yǔ)義理解接口對(duì)搜索文本和索引庫(kù)文本相似度計(jì)算,能夠提高全文檢索的準(zhǔn)確性。