一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類及存儲(chǔ)方法

基本信息

申請(qǐng)?zhí)?/td> CN201611174644.8 申請(qǐng)日 -
公開(公告)號(hào) CN106682136A 公開(公告)日 2017-05-17
申請(qǐng)公布號(hào) CN106682136A 申請(qǐng)公布日 2017-05-17
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 譚紅春;孟慶全;谷宗運(yùn);耿英保 申請(qǐng)(專利權(quán))人 深圳市宜遠(yuǎn)智能科技有限公司
代理機(jī)構(gòu) 北京和信華成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 譚紅春;深圳市宜遠(yuǎn)智能科技有限公司
地址 230000 安徽省合肥市蜀山區(qū)梅山路70號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類及存儲(chǔ)方法,其包括步驟:獲取中醫(yī)醫(yī)學(xué)文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫;分別按照下載的先后順序,以特定的編碼格式保存;對(duì)下載的非結(jié)構(gòu)化的文本數(shù)據(jù)進(jìn)行關(guān)鍵信息提取,建立中醫(yī)醫(yī)學(xué)文獻(xiàn)的關(guān)鍵信息的編碼表;將核心數(shù)據(jù)對(duì)應(yīng)的所有關(guān)鍵詞劃分到若干核心數(shù)據(jù)群中;同時(shí)將非核心數(shù)據(jù)對(duì)應(yīng)的所有關(guān)鍵詞劃分到若干非核心數(shù)據(jù)群中;獲取到中醫(yī)文獻(xiàn)關(guān)鍵詞組合,并根據(jù)中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為檢索關(guān)鍵詞獲取到相應(yīng)的中醫(yī)文獻(xiàn)作為中醫(yī)醫(yī)學(xué)文獻(xiàn),將所述中醫(yī)醫(yī)學(xué)文獻(xiàn)進(jìn)行存儲(chǔ),并將所述中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為所述中醫(yī)醫(yī)學(xué)文獻(xiàn)存儲(chǔ)標(biāo)識(shí)。本發(fā)明實(shí)現(xiàn)了高效與準(zhǔn)確的獲取中醫(yī)學(xué)文獻(xiàn)數(shù)據(jù),完成了中醫(yī)醫(yī)學(xué)文獻(xiàn)的精確分類存儲(chǔ)。