一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類及存儲(chǔ)方法
基本信息
申請(qǐng)?zhí)?/td> | CN201611174644.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN106682136A | 公開(公告)日 | 2017-05-17 |
申請(qǐng)公布號(hào) | CN106682136A | 申請(qǐng)公布日 | 2017-05-17 |
分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 譚紅春;孟慶全;谷宗運(yùn);耿英保 | 申請(qǐng)(專利權(quán))人 | 深圳市宜遠(yuǎn)智能科技有限公司 |
代理機(jī)構(gòu) | 北京和信華成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 譚紅春;深圳市宜遠(yuǎn)智能科技有限公司 |
地址 | 230000 安徽省合肥市蜀山區(qū)梅山路70號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類及存儲(chǔ)方法,其包括步驟:獲取中醫(yī)醫(yī)學(xué)文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫;分別按照下載的先后順序,以特定的編碼格式保存;對(duì)下載的非結(jié)構(gòu)化的文本數(shù)據(jù)進(jìn)行關(guān)鍵信息提取,建立中醫(yī)醫(yī)學(xué)文獻(xiàn)的關(guān)鍵信息的編碼表;將核心數(shù)據(jù)對(duì)應(yīng)的所有關(guān)鍵詞劃分到若干核心數(shù)據(jù)群中;同時(shí)將非核心數(shù)據(jù)對(duì)應(yīng)的所有關(guān)鍵詞劃分到若干非核心數(shù)據(jù)群中;獲取到中醫(yī)文獻(xiàn)關(guān)鍵詞組合,并根據(jù)中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為檢索關(guān)鍵詞獲取到相應(yīng)的中醫(yī)文獻(xiàn)作為中醫(yī)醫(yī)學(xué)文獻(xiàn),將所述中醫(yī)醫(yī)學(xué)文獻(xiàn)進(jìn)行存儲(chǔ),并將所述中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為所述中醫(yī)醫(yī)學(xué)文獻(xiàn)存儲(chǔ)標(biāo)識(shí)。本發(fā)明實(shí)現(xiàn)了高效與準(zhǔn)確的獲取中醫(yī)學(xué)文獻(xiàn)數(shù)據(jù),完成了中醫(yī)醫(yī)學(xué)文獻(xiàn)的精確分類存儲(chǔ)。 |
