基于圖神經(jīng)網(wǎng)絡(luò)的文檔處理方法、裝置和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202010916293.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112214993A | 公開(kāi)(公告)日 | 2021-01-12 |
申請(qǐng)公布號(hào) | CN112214993A | 申請(qǐng)公布日 | 2021-01-12 |
分類(lèi)號(hào) | G06F40/242;G06F40/30;G06N3/04;G06N3/08 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王洪俊;肖詩(shī)斌;施水才 | 申請(qǐng)(專(zhuān)利權(quán))人 | 拓爾思信息技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 北京康達(dá)聯(lián)禾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 拓爾思信息技術(shù)股份有限公司 |
地址 | 100088 北京市海淀區(qū)知春路6號(hào)(錦秋國(guó)際大廈)14層14B04 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于文檔處理和檢索技術(shù)領(lǐng)域,為了解決現(xiàn)有基于傳統(tǒng)的關(guān)鍵詞檢索技術(shù),無(wú)法挖掘詞語(yǔ)、句子、文檔之間的語(yǔ)義關(guān)系,檢索效果差的技術(shù)問(wèn)題;本發(fā)明一種基于圖神經(jīng)網(wǎng)絡(luò)的文檔處理方法、裝置、電子裝置和非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),所述方法采用基于有監(jiān)督學(xué)習(xí)的圖神經(jīng)網(wǎng)絡(luò)技術(shù)將語(yǔ)義詞圖生成深度語(yǔ)義向量,應(yīng)用二值化編碼器技術(shù),將語(yǔ)義向量轉(zhuǎn)化為二進(jìn)制編碼形式,進(jìn)而生成字符特征向量,并構(gòu)建倒排索引;使得處理后的文檔,在檢索過(guò)程中,能夠基于字符特征索引和檢索技術(shù)進(jìn)行高性能檢索與語(yǔ)義匹配,有效地提升語(yǔ)義檢索結(jié)果相關(guān)性。 |
