從文檔處理系統(tǒng)的文檔集合中篩選優(yōu)質(zhì)文檔的方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201110428369.9 申請(qǐng)日 -
公開(公告)號(hào) CN102521377B 公開(公告)日 2014-02-05
申請(qǐng)公布號(hào) CN102521377B 申請(qǐng)公布日 2014-02-05
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉松濤 申請(qǐng)(專利權(quán))人 北京經(jīng)輿典網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 北京漢昊知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 馮譜
地址 100078 北京市豐臺(tái)區(qū)芳古園一區(qū)17樓1門1105號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種從文檔處理系統(tǒng)的文檔集合中篩選出優(yōu)質(zhì)文檔的方法,該方法包括:A.為文檔集合中所有文檔設(shè)置初始分值;B.從所述文檔集合中隨機(jī)抽取兩個(gè)文檔,并接收針對(duì)所述兩個(gè)文檔的判斷結(jié)果,根據(jù)所述判斷結(jié)果分別修改所述兩個(gè)文檔的初始分值;C.重復(fù)步驟B,直至遍歷至少部分所述文檔集合;D.根據(jù)所述文檔的得分對(duì)所述文檔集合進(jìn)行排序處理,并將其中排名靠前或得分超過(guò)特定閾值的文檔標(biāo)注為優(yōu)質(zhì)文檔。相應(yīng)地,本發(fā)明還提供了一種從文檔處理系統(tǒng)的文檔集合中篩選出優(yōu)質(zhì)文檔的系統(tǒng)。實(shí)施本發(fā)明有助于提高從文檔集合中篩選出優(yōu)質(zhì)文檔的準(zhǔn)確性。