基于圖神經(jīng)網(wǎng)絡(luò)的文檔處理方法、裝置和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010916293.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112214993A 公開(kāi)(公告)日 2021-01-12
申請(qǐng)公布號(hào) CN112214993A 申請(qǐng)公布日 2021-01-12
分類(lèi)號(hào) G06F40/242;G06F40/30;G06N3/04;G06N3/08 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王洪俊;肖詩(shī)斌;施水才 申請(qǐng)(專(zhuān)利權(quán))人 拓爾思信息技術(shù)股份有限公司
代理機(jī)構(gòu) 北京康達(dá)聯(lián)禾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 拓爾思信息技術(shù)股份有限公司
地址 100088 北京市海淀區(qū)知春路6號(hào)(錦秋國(guó)際大廈)14層14B04
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于文檔處理和檢索技術(shù)領(lǐng)域,為了解決現(xiàn)有基于傳統(tǒng)的關(guān)鍵詞檢索技術(shù),無(wú)法挖掘詞語(yǔ)、句子、文檔之間的語(yǔ)義關(guān)系,檢索效果差的技術(shù)問(wèn)題;本發(fā)明一種基于圖神經(jīng)網(wǎng)絡(luò)的文檔處理方法、裝置、電子裝置和非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),所述方法采用基于有監(jiān)督學(xué)習(xí)的圖神經(jīng)網(wǎng)絡(luò)技術(shù)將語(yǔ)義詞圖生成深度語(yǔ)義向量,應(yīng)用二值化編碼器技術(shù),將語(yǔ)義向量轉(zhuǎn)化為二進(jìn)制編碼形式,進(jìn)而生成字符特征向量,并構(gòu)建倒排索引;使得處理后的文檔,在檢索過(guò)程中,能夠基于字符特征索引和檢索技術(shù)進(jìn)行高性能檢索與語(yǔ)義匹配,有效地提升語(yǔ)義檢索結(jié)果相關(guān)性。