文件統(tǒng)計(jì)方法和文件統(tǒng)計(jì)系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201510925466.7 申請(qǐng)日 -
公開(公告)號(hào) CN105512306B 公開(公告)日 2020-04-07
申請(qǐng)公布號(hào) CN105512306B 申請(qǐng)公布日 2020-04-07
分類號(hào) G06F16/17;G06F16/182;G06F16/18 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 梁敬彪;李躍紅;劉文嬌;徐珂 申請(qǐng)(專利權(quán))人 北京世界星輝科技有限責(zé)任公司
代理機(jī)構(gòu) 北京華沛德權(quán)律師事務(wù)所 代理人 房德權(quán)
地址 100043 北京市石景山區(qū)西井路17號(hào)2號(hào)樓2層201室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文件統(tǒng)計(jì)方法和文件統(tǒng)計(jì)系統(tǒng)。該文件統(tǒng)計(jì)方法包括:從文本文件中抽取一個(gè)或多個(gè)文件片段,其中,一個(gè)或多個(gè)文件片段中的每一個(gè)文件片段具有特定數(shù)據(jù)量;檢測(cè)一個(gè)或多個(gè)文件片段中的每一個(gè)文件片段的行數(shù);根據(jù)一個(gè)或多個(gè)文件片段中的每一個(gè)文件片段的行數(shù)計(jì)算具有特定數(shù)據(jù)量的文件片段的平均行數(shù);以及根據(jù)具有特定數(shù)據(jù)量的文件片段的平均行數(shù)和文本文件的數(shù)據(jù)量估計(jì)文本文件的行數(shù)。根據(jù)本發(fā)明提供的文件統(tǒng)計(jì)方法和文件統(tǒng)計(jì)系統(tǒng),采用抽樣方式確定文本文件中的具有特定數(shù)據(jù)量的文件片段的平均行數(shù),并進(jìn)一步基于該平均行數(shù)估計(jì)整個(gè)文本文件的行數(shù),這種方式簡(jiǎn)單高效、成本低,可以較準(zhǔn)確地估計(jì)出整個(gè)文本文件的行數(shù)。