一種公式相似度計(jì)算方法和科技文檔檢索方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910510665.X 申請(qǐng)日 -
公開(公告)號(hào) CN110414319B 公開(公告)日 2021-08-31
申請(qǐng)公布號(hào) CN110414319B 申請(qǐng)公布日 2021-08-31
分類號(hào) G06K9/00;G06F16/332;G06F16/338 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 韓光;周獻(xiàn)民;馮文化;崔永進(jìn);蘭靜;楊楊;田寶松 申請(qǐng)(專利權(quán))人 中國軟件與技術(shù)服務(wù)股份有限公司
代理機(jī)構(gòu) 北京君尚知識(shí)產(chǎn)權(quán)代理有限公司 代理人 邱曉鋒
地址 100081 北京市海淀區(qū)學(xué)院南路55號(hào)(中軟大廈)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于有效匹配子樹的公式相似度計(jì)算方法和科技文檔檢索方法及裝置。該公式相似度計(jì)算方法包括:1)將數(shù)學(xué)公式解析為樹結(jié)構(gòu),并從樹結(jié)構(gòu)中提取有效子樹信息;2)利用提取的有效子樹信息,將數(shù)學(xué)公式表示為有效子樹的有序多重集;3)根據(jù)有效子樹找到有效匹配子樹,并計(jì)算有效匹配子樹的權(quán)重加和,得到權(quán)重和相似度;4)對(duì)權(quán)重和相似度進(jìn)行標(biāo)準(zhǔn)化處理,得到最終的公式相似度。進(jìn)一步可基于該公式相似度計(jì)算方法進(jìn)行科技文檔檢索。本發(fā)明能夠解決現(xiàn)有技術(shù)中公式子樹不獨(dú)立而產(chǎn)生的無效匹配問題,能夠使公式相似度計(jì)算的準(zhǔn)確性得到明顯提升。