一種文檔建模方法

基本信息

申請?zhí)?/td> CN201710617657.6 申請日 -
公開(公告)號 CN107357927A 公開(公告)日 2017-11-17
申請公布號 CN107357927A 申請公布日 2017-11-17
分類號 G06F17/30(2006.01)I;G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李雙印;潘嶸 申請(專利權(quán))人 深圳愛拼信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 518057 廣東省深圳市南山區(qū)南山街道科技園中區(qū)科苑路15號科興科學(xué)園B棟3單元1801號單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文檔建模方法,通過設(shè)計一種能夠同時利用單詞和標(biāo)簽信息,以及自動利用標(biāo)簽種類信息,對半結(jié)構(gòu)化文檔進(jìn)行有效的建模。并且利用自主補(bǔ)償機(jī)制,在深度玻爾茲曼機(jī)中,學(xué)習(xí)不同種類的標(biāo)簽信息對文檔建模的作用,可以充分考慮不同標(biāo)簽種類的異構(gòu)信息,從而學(xué)習(xí)到更加有效的半結(jié)構(gòu)化文檔向量。