一種文檔建模方法

基本信息

申請?zhí)?/td> CN201710617657.6 申請日 -
公開(公告)號 CN107357927B 公開(公告)日 2017-11-17
申請公布號 CN107357927B 申請公布日 2017-11-17
分類號 G06F16/35(2019.01)I 分類 -
發(fā)明人 李雙印;潘嶸 申請(專利權)人 深圳愛拼信息科技有限公司
代理機構 廣州越華專利代理事務所(普通合伙) 代理人 深圳愛拼信息科技有限公司
地址 518057廣東省深圳市南山區(qū)南山街道科技園中區(qū)科苑路15號科興科學園B棟3單元1801號單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文檔建模方法,通過設計一種能夠同時利用單詞和標簽信息,以及自動利用標簽種類信息,對半結構化文檔進行有效的建模。并且利用自主補償機制,在深度玻爾茲曼機中,學習不同種類的標簽信息對文檔建模的作用,可以充分考慮不同標簽種類的異構信息,從而學習到更加有效的半結構化文檔向量。??