一種準(zhǔn)確識(shí)別分子相互作用及其極性和方向性方法
基本信息
申請(qǐng)?zhí)?/td> | CN201910571327.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110349620B | 公開(公告)日 | 2019-10-18 |
申請(qǐng)公布號(hào) | CN110349620B | 申請(qǐng)公布日 | 2019-10-18 |
分類號(hào) | G16B15/00(2019.01)I | 分類 | - |
發(fā)明人 | 汪佳宏;章建平;黃仲曦;潘星華 | 申請(qǐng)(專利權(quán))人 | 廣州序科碼生物技術(shù)有限責(zé)任公司 |
代理機(jī)構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | 南方醫(yī)科大學(xué);廣州序科碼生物技術(shù)有限責(zé)任公司 |
地址 | 510000廣東省廣州市沙太南路1023號(hào)-1063號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種從PubMed文獻(xiàn)準(zhǔn)確識(shí)別分子相互作用及其極性和方向性方法:利用PubMed文獻(xiàn)挖掘的形式在醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫識(shí)別含有至少兩個(gè)基因獲得候選證據(jù)句子,收集訓(xùn)練數(shù)據(jù),收集互作詞并對(duì)其分類,簡化訓(xùn)練語句提取描述基因調(diào)控的常見表達(dá)模式;將常見表達(dá)模式制定Semgrex表達(dá)式,依存樹上抓取兩兩基因和互作詞的三元關(guān)系,確定分子相互作用的方向,并根據(jù)上下文語義校正和明確分子相互作用及其極性,在訓(xùn)練集上反復(fù)檢驗(yàn)和優(yōu)化識(shí)別方法,最終將建立的基因調(diào)控識(shí)別方法應(yīng)用于醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫的候選證據(jù)句子的識(shí)別,獲得準(zhǔn)確的分子相互作用及其極性和方向。本發(fā)明最大的優(yōu)點(diǎn)是通過表達(dá)模式和互作詞的限定提高識(shí)別的準(zhǔn)確率。?? |
