對文檔管理系統(tǒng)中的文檔集合進行分類的方法以及系統(tǒng)

基本信息

申請?zhí)?/td> CN201110427970.6 申請日 -
公開(公告)號 CN102591920A 公開(公告)日 2012-07-18
申請公布號 CN102591920A 申請公布日 2012-07-18
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉松濤 申請(專利權(quán))人 北京經(jīng)輿典網(wǎng)絡(luò)科技有限公司
代理機構(gòu) 北京漢昊知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 馮譜
地址 100078 北京市豐臺區(qū)芳古園一區(qū)17樓1門1105號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種對文檔管理系統(tǒng)中的文檔集合進行分類的方法,該方法包括:分析所述文檔集合,從該文檔集合中的每一文檔內(nèi)抽取特征值,并根據(jù)該特征值生成特征標(biāo)簽,每一所述特征標(biāo)簽對應(yīng)所述文檔集合中的一個或多個文檔;選取所述文檔集合的全集或非空子集;構(gòu)建條件模型,該條件模型包括多個類別,每一所述類別關(guān)聯(lián)一個或多個所述特征標(biāo)簽以及包括該一個或多個特征標(biāo)簽在所述全集或非空子集內(nèi)對應(yīng)的全部或部分文檔;根據(jù)所述條件模型對所述全集或非空子集中包括的文檔進行分類。相應(yīng)地,本發(fā)明還提供了一種對文檔管理系統(tǒng)中的文檔集合進行分類的系統(tǒng)。實施本發(fā)明可以降低文檔分類的時間復(fù)雜度以及實現(xiàn)對大量文檔按照任意需求進行多維度分類管理。