一種基于語義分析與關(guān)鍵詞識(shí)別的檢索方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202011442031.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112507109A | 公開(公告)日 | 2021-03-16 |
申請(qǐng)公布號(hào) | CN112507109A | 申請(qǐng)公布日 | 2021-03-16 |
分類號(hào) | G06F40/284(2020.01)I;G06F40/205(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06F16/335(2019.01)I;G06F16/338(2019.01)I;G06F40/30(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉偉;劉燦;吳永杰;鐘延珍;陳善雄;李莉;李磊;王雪春;王仲煜 | 申請(qǐng)(專利權(quán))人 | 重慶知識(shí)產(chǎn)權(quán)大數(shù)據(jù)研究院有限公司 |
代理機(jī)構(gòu) | 重慶智慧之源知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 高彬 |
地址 | 400023重慶市江北區(qū)五江路18號(hào)1-1號(hào)、附1號(hào)1-8室6號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于語義分析與關(guān)鍵詞識(shí)別的檢索方法和裝置,包括以下步驟:通過Textrank算法對(duì)專利文本提取專利關(guān)鍵詞,獲取專利關(guān)鍵詞數(shù)據(jù)集,并根據(jù)Elmo動(dòng)態(tài)詞向量轉(zhuǎn)換算法進(jìn)行向量轉(zhuǎn)換,獲取專利關(guān)鍵詞向量集;通過層次分析法對(duì)專利文本的標(biāo)題、摘要、首項(xiàng)權(quán)利要求和技術(shù)功效句確定權(quán)重,并根據(jù)待檢索關(guān)鍵詞從高權(quán)重到低權(quán)重對(duì)指標(biāo)信息中的關(guān)鍵詞進(jìn)行匹配,獲取匹配關(guān)鍵詞向量集,并將匹配關(guān)鍵詞向量集輸入權(quán)重模型,計(jì)算對(duì)應(yīng)專利文本的權(quán)重值,根據(jù)權(quán)重值進(jìn)行TOP?K排序,形成檢索結(jié)果并呈現(xiàn)至用戶端。本發(fā)明能夠擴(kuò)大相關(guān)專利的覆蓋面,對(duì)專利文本中的內(nèi)容進(jìn)行語義分析和關(guān)鍵詞識(shí)別,從而提高檢索結(jié)果的相關(guān)性。?? |
