一種準確識別分子相互作用及其極性和方向性方法

基本信息

申請?zhí)?/td> CN201910571327.7 申請日 -
公開(公告)號 CN110349620B 公開(公告)日 2019-10-18
申請公布號 CN110349620B 申請公布日 2019-10-18
分類號 G16B15/00(2019.01)I 分類 -
發(fā)明人 汪佳宏;章建平;黃仲曦;潘星華 申請(專利權)人 廣州序科碼生物技術有限責任公司
代理機構 廣州三環(huán)專利商標代理有限公司 代理人 南方醫(yī)科大學;廣州序科碼生物技術有限責任公司
地址 510000廣東省廣州市沙太南路1023號-1063號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種從PubMed文獻準確識別分子相互作用及其極性和方向性方法:利用PubMed文獻挖掘的形式在醫(yī)學文獻數據庫識別含有至少兩個基因獲得候選證據句子,收集訓練數據,收集互作詞并對其分類,簡化訓練語句提取描述基因調控的常見表達模式;將常見表達模式制定Semgrex表達式,依存樹上抓取兩兩基因和互作詞的三元關系,確定分子相互作用的方向,并根據上下文語義校正和明確分子相互作用及其極性,在訓練集上反復檢驗和優(yōu)化識別方法,最終將建立的基因調控識別方法應用于醫(yī)學文獻數據庫的候選證據句子的識別,獲得準確的分子相互作用及其極性和方向。本發(fā)明最大的優(yōu)點是通過表達模式和互作詞的限定提高識別的準確率。??