一種比較中藥處方相似性的方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110553551.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113554053A | 公開(公告)日 | 2021-10-26 |
申請(qǐng)公布號(hào) | CN113554053A | 申請(qǐng)公布日 | 2021-10-26 |
分類號(hào) | G06K9/62(2006.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I;G06F40/126(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李天泉;楊建明;史曉雨;張好霞;郭詩琦;陳浩 | 申請(qǐng)(專利權(quán))人 | 重慶康洲大數(shù)據(jù)(集團(tuán))有限公司 |
代理機(jī)構(gòu) | 北京匯澤知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 武君 |
地址 | 401336重慶市南岸區(qū)玉馬路8號(hào)B棟第二層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種比較中藥處方相似性的方法,包括:對(duì)中藥處方數(shù)據(jù)庫中的中藥處方文本進(jìn)行分詞,生成詞匯表;根據(jù)所述詞匯表生成藥材分詞向量;計(jì)算每個(gè)處方中的藥材分詞向量的分詞權(quán)重;根據(jù)所述藥材的分詞向量與對(duì)應(yīng)的所述分詞權(quán)重生成處方的短文本向量;獲取短文本向量之間的相互關(guān)聯(lián)程度;根據(jù)所述短文本向量之間的相互關(guān)聯(lián)程度計(jì)算處方相似度。本發(fā)明提供一種比較中藥處方相似性的方法,用one?hot編碼處理處方中藥材的詞向量,再利用TF?IDF和Word2Vec進(jìn)行處方短文本特性向量,最后采用計(jì)算信息增益的方法計(jì)算處方短文本向量的關(guān)聯(lián)程度,歸一化后得到處方之間的相似度,將比較結(jié)果和解釋展示給用戶,實(shí)現(xiàn)了更加高效、快捷、準(zhǔn)確的實(shí)現(xiàn)中藥處方的相似度比較功能。 |
