一種文檔建模方法

基本信息

申請(qǐng)?zhí)?/td> CN201710617657.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107357927A 公開(kāi)(公告)日 2017-11-17
申請(qǐng)公布號(hào) CN107357927A 申請(qǐng)公布日 2017-11-17
分類號(hào) G06F17/30(2006.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李雙印;潘嶸 申請(qǐng)(專利權(quán))人 深圳愛(ài)拼信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 518057 廣東省深圳市南山區(qū)南山街道科技園中區(qū)科苑路15號(hào)科興科學(xué)園B棟3單元1801號(hào)單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種文檔建模方法,通過(guò)設(shè)計(jì)一種能夠同時(shí)利用單詞和標(biāo)簽信息,以及自動(dòng)利用標(biāo)簽種類信息,對(duì)半結(jié)構(gòu)化文檔進(jìn)行有效的建模。并且利用自主補(bǔ)償機(jī)制,在深度玻爾茲曼機(jī)中,學(xué)習(xí)不同種類的標(biāo)簽信息對(duì)文檔建模的作用,可以充分考慮不同標(biāo)簽種類的異構(gòu)信息,從而學(xué)習(xí)到更加有效的半結(jié)構(gòu)化文檔向量。