一種通過xml文檔對office文件解析的方法
基本信息
申請?zhí)?/td> | CN201911406481.5 | 申請日 | - |
公開(公告)號 | CN113128178A | 公開(公告)日 | 2021-07-16 |
申請公布號 | CN113128178A | 申請公布日 | 2021-07-16 |
分類號 | G06F40/154(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉志強 | 申請(專利權(quán))人 | 安徽佰通教育科技發(fā)展股份有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 230031安徽省合肥市蜀山區(qū)望江西路印象西湖花園第西團組6層2-602室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種通過xml文檔對office文件解析的方法,包括以下步驟:a、將word文件名稱為word.docx的擴展名修改為zip,word文件會變成壓縮文件,并形成壓縮文件名稱word.zip;b、通過解壓軟件對word.zip文件進行解壓,并形成多個標(biāo)準的xml文件。有益效果是:通過獲取XML文檔讀取指令,該讀取指令中包括至少一個待讀取行標(biāo)識,根據(jù)上述至少一個待讀取行標(biāo)識,在XML文檔中讀取出上述至少一個待讀取行標(biāo)識對應(yīng)的至少一行數(shù)據(jù),并將這至少一行數(shù)據(jù)轉(zhuǎn)換為節(jié)點樹,對該節(jié)點樹上的節(jié)點進行解析,獲取解析結(jié)果,實現(xiàn)了只需要根據(jù)讀取指令讀取需要讀取的行數(shù)據(jù)即可,而無需讀取整個文檔,大大降低了計算機內(nèi)存的消耗,避免了內(nèi)存溢出的現(xiàn)象。 |
