一種從PubMed文獻(xiàn)篩選基因關(guān)鍵詞的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201910571336.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110349632B | 公開(公告)日 | 2019-10-18 |
申請(qǐng)公布號(hào) | CN110349632B | 申請(qǐng)公布日 | 2019-10-18 |
分類號(hào) | G16B50/10(2019.01)I | 分類 | - |
發(fā)明人 | 汪佳宏;章建平;黃仲曦;潘星華 | 申請(qǐng)(專利權(quán))人 | 廣州序科碼生物技術(shù)有限責(zé)任公司 |
代理機(jī)構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | 南方醫(yī)科大學(xué);廣州序科碼生物技術(shù)有限責(zé)任公司 |
地址 | 510000廣東省廣州市沙太南路1023號(hào)-1063號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 一種從PubMed文獻(xiàn)篩選基因關(guān)鍵詞的方法。本發(fā)明提供了一種從文獻(xiàn)數(shù)據(jù)庫篩選基因關(guān)鍵詞的方法,包括以下步驟:從文獻(xiàn)數(shù)據(jù)庫的摘要中識(shí)別基因相關(guān)摘要或/和基因相關(guān)句子,建立基因相關(guān)文獻(xiàn)的全文索引,從術(shù)語庫中篩選關(guān)鍵詞,通過基因?關(guān)鍵詞關(guān)聯(lián)評(píng)分計(jì)算公式獲得基因和關(guān)鍵詞的關(guān)聯(lián)概率評(píng)分,篩選出與基因密切相關(guān)的關(guān)鍵詞。本發(fā)明構(gòu)建的方法一方面擴(kuò)寬了事先定義的術(shù)語詞匯庫,除了GO術(shù)語外,整合其他權(quán)威數(shù)據(jù)庫的術(shù)語;另一方面引入新的關(guān)鍵詞篩選方法,對(duì)基因與術(shù)語存在關(guān)聯(lián)的概率進(jìn)行評(píng)分,綜合基因和關(guān)鍵詞共發(fā)生于摘要和句子的次數(shù),篩選更牢固的基因?關(guān)鍵詞關(guān)聯(lián)。?? |
