一種準(zhǔn)確識(shí)別分子相互作用及其極性和方向性方法

基本信息

申請(qǐng)?zhí)?/td> CN201910571327.7 申請(qǐng)日 -
公開(公告)號(hào) CN110349620B 公開(公告)日 2019-10-18
申請(qǐng)公布號(hào) CN110349620B 申請(qǐng)公布日 2019-10-18
分類號(hào) G16B15/00(2019.01)I 分類 -
發(fā)明人 汪佳宏;章建平;黃仲曦;潘星華 申請(qǐng)(專利權(quán))人 廣州序科碼生物技術(shù)有限責(zé)任公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 南方醫(yī)科大學(xué);廣州序科碼生物技術(shù)有限責(zé)任公司
地址 510000廣東省廣州市沙太南路1023號(hào)-1063號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種從PubMed文獻(xiàn)準(zhǔn)確識(shí)別分子相互作用及其極性和方向性方法:利用PubMed文獻(xiàn)挖掘的形式在醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫識(shí)別含有至少兩個(gè)基因獲得候選證據(jù)句子,收集訓(xùn)練數(shù)據(jù),收集互作詞并對(duì)其分類,簡化訓(xùn)練語句提取描述基因調(diào)控的常見表達(dá)模式;將常見表達(dá)模式制定Semgrex表達(dá)式,依存樹上抓取兩兩基因和互作詞的三元關(guān)系,確定分子相互作用的方向,并根據(jù)上下文語義校正和明確分子相互作用及其極性,在訓(xùn)練集上反復(fù)檢驗(yàn)和優(yōu)化識(shí)別方法,最終將建立的基因調(diào)控識(shí)別方法應(yīng)用于醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫的候選證據(jù)句子的識(shí)別,獲得準(zhǔn)確的分子相互作用及其極性和方向。本發(fā)明最大的優(yōu)點(diǎn)是通過表達(dá)模式和互作詞的限定提高識(shí)別的準(zhǔn)確率。??