文件統(tǒng)計(jì)方法和文件統(tǒng)計(jì)系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201510925466.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN105512306B | 公開(公告)日 | 2020-04-07 |
申請(qǐng)公布號(hào) | CN105512306B | 申請(qǐng)公布日 | 2020-04-07 |
分類號(hào) | G06F16/17;G06F16/182;G06F16/18 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 梁敬彪;李躍紅;劉文嬌;徐珂 | 申請(qǐng)(專利權(quán))人 | 北京世界星輝科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京華沛德權(quán)律師事務(wù)所 | 代理人 | 房德權(quán) |
地址 | 100043 北京市石景山區(qū)西井路17號(hào)2號(hào)樓2層201室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種文件統(tǒng)計(jì)方法和文件統(tǒng)計(jì)系統(tǒng)。該文件統(tǒng)計(jì)方法包括:從文本文件中抽取一個(gè)或多個(gè)文件片段,其中,一個(gè)或多個(gè)文件片段中的每一個(gè)文件片段具有特定數(shù)據(jù)量;檢測(cè)一個(gè)或多個(gè)文件片段中的每一個(gè)文件片段的行數(shù);根據(jù)一個(gè)或多個(gè)文件片段中的每一個(gè)文件片段的行數(shù)計(jì)算具有特定數(shù)據(jù)量的文件片段的平均行數(shù);以及根據(jù)具有特定數(shù)據(jù)量的文件片段的平均行數(shù)和文本文件的數(shù)據(jù)量估計(jì)文本文件的行數(shù)。根據(jù)本發(fā)明提供的文件統(tǒng)計(jì)方法和文件統(tǒng)計(jì)系統(tǒng),采用抽樣方式確定文本文件中的具有特定數(shù)據(jù)量的文件片段的平均行數(shù),并進(jìn)一步基于該平均行數(shù)估計(jì)整個(gè)文本文件的行數(shù),這種方式簡(jiǎn)單高效、成本低,可以較準(zhǔn)確地估計(jì)出整個(gè)文本文件的行數(shù)。 |
