一種基于詞頻和語義計算專利文獻(xiàn)相似度的智能檢索方法、裝置、電子設(shè)備及其存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011227890.1 申請日 -
公開(公告)號 CN112257419B 公開(公告)日 2021-05-28
申請公布號 CN112257419B 申請公布日 2021-05-28
分類號 G06F40/242(2020.01)I;G06F16/33(2019.01)I;G06K9/62(2006.01)I;G06F40/30(2020.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I 分類 -
發(fā)明人 汪敏;嚴(yán)妍;肖國泉;裴非;肖克;彭祖劍;邵羅樹;趙達(dá);石鑫 申請(專利權(quán))人 北京開普云信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 523000廣東省東莞市石龍鎮(zhèn)中山東東升路1號匯星商業(yè)中心5棟2單元1805室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于詞頻和語義計算專利文獻(xiàn)相似度的智能檢索方法、裝置、電子設(shè)備及其存儲介質(zhì),對專利數(shù)據(jù)庫中的所有文獻(xiàn)進(jìn)行詞袋統(tǒng)計和詞向量計算,得到對應(yīng)的詞袋數(shù)據(jù)和詞距離數(shù)據(jù);建立模型,輸入內(nèi)容或考題號,在題庫數(shù)據(jù)中獲取待審專利的標(biāo)題、摘要、權(quán)利要求書、說明書進(jìn)行多種組合,并分別根據(jù)詞袋算法和語義算法進(jìn)行粗選和細(xì)選,針對選擇后數(shù)據(jù)進(jìn)行文本相似度分析,將分析結(jié)果融合排序得到綜合相似度,經(jīng)查重篩選,給出待查專利的可疑答案集合。本發(fā)明提升了檢索速度,采用兩輪篩選,第一輪粗選旨在快速縮小對比范圍,第二輪細(xì)選旨在兼顧提高準(zhǔn)確率;可以有效節(jié)省人力和時間,幫助專利審查員縮減相關(guān)專利審查范圍,提高審查效率。??