一種通過xml文檔對office文件解析的方法

基本信息

申請?zhí)?/td> CN201911406481.5 申請日 -
公開(公告)號 CN113128178A 公開(公告)日 2021-07-16
申請公布號 CN113128178A 申請公布日 2021-07-16
分類號 G06F40/154(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉志強 申請(專利權(quán))人 安徽佰通教育科技發(fā)展股份有限公司
代理機構(gòu) - 代理人 -
地址 230031安徽省合肥市蜀山區(qū)望江西路印象西湖花園第西團組6層2-602室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種通過xml文檔對office文件解析的方法,包括以下步驟:a、將word文件名稱為word.docx的擴展名修改為zip,word文件會變成壓縮文件,并形成壓縮文件名稱word.zip;b、通過解壓軟件對word.zip文件進行解壓,并形成多個標(biāo)準的xml文件。有益效果是:通過獲取XML文檔讀取指令,該讀取指令中包括至少一個待讀取行標(biāo)識,根據(jù)上述至少一個待讀取行標(biāo)識,在XML文檔中讀取出上述至少一個待讀取行標(biāo)識對應(yīng)的至少一行數(shù)據(jù),并將這至少一行數(shù)據(jù)轉(zhuǎn)換為節(jié)點樹,對該節(jié)點樹上的節(jié)點進行解析,獲取解析結(jié)果,實現(xiàn)了只需要根據(jù)讀取指令讀取需要讀取的行數(shù)據(jù)即可,而無需讀取整個文檔,大大降低了計算機內(nèi)存的消耗,避免了內(nèi)存溢出的現(xiàn)象。