一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類及存儲方法

基本信息

申請?zhí)?/td> CN201611174644.8 申請日 -
公開(公告)號 CN106682136A 公開(公告)日 2017-05-17
申請公布號 CN106682136A 申請公布日 2017-05-17
分類號 G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 譚紅春;孟慶全;谷宗運(yùn);耿英保 申請(專利權(quán))人 深圳市宜遠(yuǎn)智能科技有限公司
代理機(jī)構(gòu) 北京和信華成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 譚紅春;深圳市宜遠(yuǎn)智能科技有限公司
地址 230000 安徽省合肥市蜀山區(qū)梅山路70號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類及存儲方法,其包括步驟:獲取中醫(yī)醫(yī)學(xué)文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫;分別按照下載的先后順序,以特定的編碼格式保存;對下載的非結(jié)構(gòu)化的文本數(shù)據(jù)進(jìn)行關(guān)鍵信息提取,建立中醫(yī)醫(yī)學(xué)文獻(xiàn)的關(guān)鍵信息的編碼表;將核心數(shù)據(jù)對應(yīng)的所有關(guān)鍵詞劃分到若干核心數(shù)據(jù)群中;同時將非核心數(shù)據(jù)對應(yīng)的所有關(guān)鍵詞劃分到若干非核心數(shù)據(jù)群中;獲取到中醫(yī)文獻(xiàn)關(guān)鍵詞組合,并根據(jù)中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為檢索關(guān)鍵詞獲取到相應(yīng)的中醫(yī)文獻(xiàn)作為中醫(yī)醫(yī)學(xué)文獻(xiàn),將所述中醫(yī)醫(yī)學(xué)文獻(xiàn)進(jìn)行存儲,并將所述中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為所述中醫(yī)醫(yī)學(xué)文獻(xiàn)存儲標(biāo)識。本發(fā)明實(shí)現(xiàn)了高效與準(zhǔn)確的獲取中醫(yī)學(xué)文獻(xiàn)數(shù)據(jù),完成了中醫(yī)醫(yī)學(xué)文獻(xiàn)的精確分類存儲。