一種從PubMed文獻(xiàn)篩選基因關(guān)鍵詞的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201910571336.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110349632A | 公開(公告)日 | 2019-10-18 |
申請(qǐng)公布號(hào) | CN110349632A | 申請(qǐng)公布日 | 2019-10-18 |
分類號(hào) | G16B50/10;G16B50/30;G16B20/00;G16B40/00 | 分類 | 物理 |
發(fā)明人 | 汪佳宏;章建平;黃仲曦;潘星華 | 申請(qǐng)(專利權(quán))人 | 廣州序科碼生物技術(shù)有限責(zé)任公司 |
代理機(jī)構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | 廣州序科碼生物技術(shù)有限責(zé)任公司;南方醫(yī)科大學(xué) |
地址 | 510530 廣東省廣州市廣州高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)科學(xué)城開源大道11號(hào)B3棟905室 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種從PubMed文獻(xiàn)篩選基因關(guān)鍵詞的方法。本發(fā)明提供了一種從文獻(xiàn)數(shù)據(jù)庫篩選基因關(guān)鍵詞的方法,包括以下步驟:從文獻(xiàn)數(shù)據(jù)庫的摘要中識(shí)別基因相關(guān)摘要或/和基因相關(guān)句子,建立基因相關(guān)文獻(xiàn)的全文索引,從術(shù)語庫中篩選關(guān)鍵詞,通過基因?關(guān)鍵詞關(guān)聯(lián)評(píng)分計(jì)算公式獲得基因和關(guān)鍵詞的關(guān)聯(lián)概率評(píng)分,篩選出與基因密切相關(guān)的關(guān)鍵詞。本發(fā)明構(gòu)建的方法一方面擴(kuò)寬了事先定義的術(shù)語詞匯庫,除了GO術(shù)語外,整合其他權(quán)威數(shù)據(jù)庫的術(shù)語;另一方面引入新的關(guān)鍵詞篩選方法,對(duì)基因與術(shù)語存在關(guān)聯(lián)的概率進(jìn)行評(píng)分,綜合基因和關(guān)鍵詞共發(fā)生于摘要和句子的次數(shù),篩選更牢固的基因?關(guān)鍵詞關(guān)聯(lián)。 |
