一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類(lèi)及存儲(chǔ)方法

基本信息

申請(qǐng)?zhí)?/td> CN201611174644.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106682136B 公開(kāi)(公告)日 2018-03-16
申請(qǐng)公布號(hào) CN106682136B 申請(qǐng)公布日 2018-03-16
分類(lèi)號(hào) G06F17/30 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉凱;吳志力 申請(qǐng)(專(zhuān)利權(quán))人 深圳市宜遠(yuǎn)智能科技有限公司
代理機(jī)構(gòu) 深圳市蘭鋒知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉凱;深圳市宜遠(yuǎn)智能科技有限公司
地址 518000 廣東省深圳市南山區(qū)清華信息港科研樓107
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)學(xué)文獻(xiàn)分類(lèi)及存儲(chǔ)方法,其包括步驟:獲取中醫(yī)醫(yī)學(xué)文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫(kù);分別按照下載的先后順序,以特定的編碼格式保存;對(duì)下載的非結(jié)構(gòu)化的文本數(shù)據(jù)進(jìn)行關(guān)鍵信息提取,建立中醫(yī)醫(yī)學(xué)文獻(xiàn)的關(guān)鍵信息的編碼表;將核心數(shù)據(jù)對(duì)應(yīng)的所有關(guān)鍵詞劃分到若干核心數(shù)據(jù)群中;同時(shí)將非核心數(shù)據(jù)對(duì)應(yīng)的所有關(guān)鍵詞劃分到若干非核心數(shù)據(jù)群中;獲取到中醫(yī)文獻(xiàn)關(guān)鍵詞組合,并根據(jù)中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為檢索關(guān)鍵詞獲取到相應(yīng)的中醫(yī)文獻(xiàn)作為中醫(yī)醫(yī)學(xué)文獻(xiàn),將所述中醫(yī)醫(yī)學(xué)文獻(xiàn)進(jìn)行存儲(chǔ),并將所述中醫(yī)文獻(xiàn)關(guān)鍵詞組合作為所述中醫(yī)醫(yī)學(xué)文獻(xiàn)存儲(chǔ)標(biāo)識(shí)。本發(fā)明實(shí)現(xiàn)了高效與準(zhǔn)確的獲取中醫(yī)學(xué)文獻(xiàn)數(shù)據(jù),完成了中醫(yī)醫(yī)學(xué)文獻(xiàn)的精確分類(lèi)存儲(chǔ)。