一種基于ipfs的相似文件檢索方法、電子設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111152397.2 申請(qǐng)日 -
公開(公告)號(hào) CN113868195A 公開(公告)日 2021-12-31
申請(qǐng)公布號(hào) CN113868195A 申請(qǐng)公布日 2021-12-31
分類號(hào) G06F16/14(2019.01)I;G06F16/16(2019.01)I;G06F16/182(2019.01)I;G06F40/194(2020.01)I;G06F40/216(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉嶺峰;毛岱山;肖苗苗;曾佑誠(chéng);柯亞萍;林寶泉;蘇林麒;王超博;麥佩雨;王洪龍;陳意斌 申請(qǐng)(專利權(quán))人 熵鏈科技(福建)有限公司
代理機(jī)構(gòu) 廈門仕誠(chéng)聯(lián)合知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 程勁竹
地址 350000福建省福州市高新區(qū)烏龍江中大道7#創(chuàng)新園二期21號(hào)樓7層702室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于ipfs的相似文件檢索方法、電子設(shè)備及存儲(chǔ)介質(zhì)。一種基于ipfs的相似文件檢索方法,包括以下步驟:步驟一,將文件進(jìn)行分割成塊,并形成若干dag結(jié)構(gòu),dag結(jié)構(gòu)的重復(fù)度等價(jià)于文件的重復(fù)度;步驟二,對(duì)每一dag結(jié)構(gòu)的links中的hash進(jìn)行再壓縮后拼接成復(fù)合hash,將dag結(jié)構(gòu)的重復(fù)度等價(jià)于復(fù)合hash的重復(fù)度;步驟三,維護(hù)復(fù)合hash和cid的映射關(guān)系;步驟四,在搜索引擎中維護(hù)復(fù)合hash;步驟五,在搜索引擎中搜索一特定的復(fù)合hash,得到與該復(fù)合hash重復(fù)度高的其他復(fù)合hash,通過步驟三維護(hù)的映射關(guān)系,找到文件在ipfs中的cid,進(jìn)而查找到相似文件。本發(fā)明將文件的重復(fù)度轉(zhuǎn)化為復(fù)合hash的重復(fù)度,并利用搜索引擎管理復(fù)合hash,ipfs系統(tǒng)管理文件。