數(shù)據(jù)檢索方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202011302942.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112418298A | 公開(公告)日 | 2021-12-03 |
申請(qǐng)公布號(hào) | CN112418298A | 申請(qǐng)公布日 | 2021-12-03 |
分類號(hào) | G06K9/62;G06F16/903 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 程子翰;田國(guó)棟 | 申請(qǐng)(專利權(quán))人 | 北京云從科技有限公司 |
代理機(jī)構(gòu) | 北京瀚仁知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 屠曉旭;宋寶庫(kù) |
地址 | 102300 北京市門頭溝區(qū)石龍經(jīng)濟(jì)開發(fā)區(qū)永安路20號(hào)3號(hào)樓一層102室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及數(shù)據(jù)檢索技術(shù)領(lǐng)域,具體提供了一種數(shù)據(jù)檢索方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),旨在解決快速且準(zhǔn)確地對(duì)大批量數(shù)據(jù)進(jìn)行數(shù)據(jù)檢索的技術(shù)問(wèn)題。為此目的,根據(jù)本發(fā)明實(shí)施例的方法,利用PQ算法對(duì)向量樣本進(jìn)行相似數(shù)據(jù)檢索,相較于暴力搜索的方法,能夠顯著提高數(shù)據(jù)的檢索效率。同時(shí),在獲取到利用PQ算法生成的向量距離查詢表之后,可以將向量距離查詢表中的浮點(diǎn)型向量距離轉(zhuǎn)換為整型向量距離,以降低向量距離查詢表的數(shù)據(jù)大小,滿足處理器的一級(jí)緩存的緩存存儲(chǔ)要求,使得處理器只需在一級(jí)緩存中加載一次向量距離查詢表,就可以完成對(duì)一個(gè)向量樣本的相似性檢索,克服了現(xiàn)有技術(shù)中由于反復(fù)加載向量距離查詢表導(dǎo)致的檢索效率下降的缺陷。 |
