對文檔管理系統(tǒng)中的文檔集合進行分類的方法以及系統(tǒng)

基本信息

申請?zhí)?/td> CN201110427970.6 申請日 -
公開(公告)號 CN102591920B 公開(公告)日 2013-11-20
申請公布號 CN102591920B 申請公布日 2013-11-20
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數;
發(fā)明人 劉松濤 申請(專利權)人 北京經輿典網絡科技有限公司
代理機構 北京漢昊知識產權代理事務所(普通合伙) 代理人 馮譜
地址 100078 北京市豐臺區(qū)芳古園一區(qū)17樓1門1105號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種對文檔管理系統(tǒng)中的文檔集合進行分類的方法,該方法包括:分析所述文檔集合,從該文檔集合中的每一文檔內抽取特征值,并根據該特征值生成特征標簽,每一所述特征標簽對應所述文檔集合中的一個或多個文檔;選取所述文檔集合的全集或非空子集;構建條件模型,該條件模型包括多個類別,每一所述類別關聯一個或多個所述特征標簽以及包括該一個或多個特征標簽在所述全集或非空子集內對應的全部或部分文檔;根據所述條件模型對所述全集或非空子集中包括的文檔進行分類。相應地,本發(fā)明還提供了一種對文檔管理系統(tǒng)中的文檔集合進行分類的系統(tǒng)。實施本發(fā)明可以降低文檔分類的時間復雜度以及實現對大量文檔按照任意需求進行多維度分類管理。