一種從PubMed文獻篩選基因關(guān)鍵詞的方法

基本信息

申請?zhí)?/td> CN201910571336.6 申請日 -
公開(公告)號 CN110349632B 公開(公告)日 2019-10-18
申請公布號 CN110349632B 申請公布日 2019-10-18
分類號 G16B50/10(2019.01)I 分類 -
發(fā)明人 汪佳宏;章建平;黃仲曦;潘星華 申請(專利權(quán))人 廣州序科碼生物技術(shù)有限責(zé)任公司
代理機構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 南方醫(yī)科大學(xué);廣州序科碼生物技術(shù)有限責(zé)任公司
地址 510000廣東省廣州市沙太南路1023號-1063號
法律狀態(tài) -

摘要

摘要 一種從PubMed文獻篩選基因關(guān)鍵詞的方法。本發(fā)明提供了一種從文獻數(shù)據(jù)庫篩選基因關(guān)鍵詞的方法,包括以下步驟:從文獻數(shù)據(jù)庫的摘要中識別基因相關(guān)摘要或/和基因相關(guān)句子,建立基因相關(guān)文獻的全文索引,從術(shù)語庫中篩選關(guān)鍵詞,通過基因?關(guān)鍵詞關(guān)聯(lián)評分計算公式獲得基因和關(guān)鍵詞的關(guān)聯(lián)概率評分,篩選出與基因密切相關(guān)的關(guān)鍵詞。本發(fā)明構(gòu)建的方法一方面擴寬了事先定義的術(shù)語詞匯庫,除了GO術(shù)語外,整合其他權(quán)威數(shù)據(jù)庫的術(shù)語;另一方面引入新的關(guān)鍵詞篩選方法,對基因與術(shù)語存在關(guān)聯(lián)的概率進行評分,綜合基因和關(guān)鍵詞共發(fā)生于摘要和句子的次數(shù),篩選更牢固的基因?關(guān)鍵詞關(guān)聯(lián)。??