一種從PubMed文獻(xiàn)篩選基因關(guān)鍵詞的方法

基本信息

申請(qǐng)?zhí)?/td> CN201910571336.6 申請(qǐng)日 -
公開(公告)號(hào) CN110349632B 公開(公告)日 2019-10-18
申請(qǐng)公布號(hào) CN110349632B 申請(qǐng)公布日 2019-10-18
分類號(hào) G16B50/10(2019.01)I 分類 -
發(fā)明人 汪佳宏;章建平;黃仲曦;潘星華 申請(qǐng)(專利權(quán))人 廣州序科碼生物技術(shù)有限責(zé)任公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 南方醫(yī)科大學(xué);廣州序科碼生物技術(shù)有限責(zé)任公司
地址 510000廣東省廣州市沙太南路1023號(hào)-1063號(hào)
法律狀態(tài) -

摘要

摘要 一種從PubMed文獻(xiàn)篩選基因關(guān)鍵詞的方法。本發(fā)明提供了一種從文獻(xiàn)數(shù)據(jù)庫篩選基因關(guān)鍵詞的方法,包括以下步驟:從文獻(xiàn)數(shù)據(jù)庫的摘要中識(shí)別基因相關(guān)摘要或/和基因相關(guān)句子,建立基因相關(guān)文獻(xiàn)的全文索引,從術(shù)語庫中篩選關(guān)鍵詞,通過基因?關(guān)鍵詞關(guān)聯(lián)評(píng)分計(jì)算公式獲得基因和關(guān)鍵詞的關(guān)聯(lián)概率評(píng)分,篩選出與基因密切相關(guān)的關(guān)鍵詞。本發(fā)明構(gòu)建的方法一方面擴(kuò)寬了事先定義的術(shù)語詞匯庫,除了GO術(shù)語外,整合其他權(quán)威數(shù)據(jù)庫的術(shù)語;另一方面引入新的關(guān)鍵詞篩選方法,對(duì)基因與術(shù)語存在關(guān)聯(lián)的概率進(jìn)行評(píng)分,綜合基因和關(guān)鍵詞共發(fā)生于摘要和句子的次數(shù),篩選更牢固的基因?關(guān)鍵詞關(guān)聯(lián)。??