一種基于語義分析與關(guān)鍵詞識(shí)別的檢索方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011442031.4 申請(qǐng)日 -
公開(公告)號(hào) CN112507109A 公開(公告)日 2021-03-16
申請(qǐng)公布號(hào) CN112507109A 申請(qǐng)公布日 2021-03-16
分類號(hào) G06F40/284(2020.01)I;G06F40/205(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06F16/335(2019.01)I;G06F16/338(2019.01)I;G06F40/30(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉偉;劉燦;吳永杰;鐘延珍;陳善雄;李莉;李磊;王雪春;王仲煜 申請(qǐng)(專利權(quán))人 重慶知識(shí)產(chǎn)權(quán)大數(shù)據(jù)研究院有限公司
代理機(jī)構(gòu) 重慶智慧之源知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 高彬
地址 400023重慶市江北區(qū)五江路18號(hào)1-1號(hào)、附1號(hào)1-8室6號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于語義分析與關(guān)鍵詞識(shí)別的檢索方法和裝置,包括以下步驟:通過Textrank算法對(duì)專利文本提取專利關(guān)鍵詞,獲取專利關(guān)鍵詞數(shù)據(jù)集,并根據(jù)Elmo動(dòng)態(tài)詞向量轉(zhuǎn)換算法進(jìn)行向量轉(zhuǎn)換,獲取專利關(guān)鍵詞向量集;通過層次分析法對(duì)專利文本的標(biāo)題、摘要、首項(xiàng)權(quán)利要求和技術(shù)功效句確定權(quán)重,并根據(jù)待檢索關(guān)鍵詞從高權(quán)重到低權(quán)重對(duì)指標(biāo)信息中的關(guān)鍵詞進(jìn)行匹配,獲取匹配關(guān)鍵詞向量集,并將匹配關(guān)鍵詞向量集輸入權(quán)重模型,計(jì)算對(duì)應(yīng)專利文本的權(quán)重值,根據(jù)權(quán)重值進(jìn)行TOP?K排序,形成檢索結(jié)果并呈現(xiàn)至用戶端。本發(fā)明能夠擴(kuò)大相關(guān)專利的覆蓋面,對(duì)專利文本中的內(nèi)容進(jìn)行語義分析和關(guān)鍵詞識(shí)別,從而提高檢索結(jié)果的相關(guān)性。??