構(gòu)建對(duì)核酸序列進(jìn)行分類(lèi)的模型方法及其應(yīng)用
基本信息
申請(qǐng)?zhí)?/td> | CN202011523286.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112599196B | 公開(kāi)(公告)日 | 2021-11-05 |
申請(qǐng)公布號(hào) | CN112599196B | 申請(qǐng)公布日 | 2021-11-05 |
分類(lèi)號(hào) | G16B30/00;G16B40/00 | 分類(lèi) | 物理 |
發(fā)明人 | 張延明;趙增祥;杜楠;張萱;朱政英;萬(wàn)麗君;王麗娜;侯全民 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京諾賽基因組研究中心有限公司 |
代理機(jī)構(gòu) | 北京漢鼎理利專(zhuān)利代理事務(wù)所(特殊普通合伙) | 代理人 | 潘滿根 |
地址 | 100176 北京市大興區(qū)北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)永昌北路3號(hào)1號(hào)樓1層01 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種構(gòu)建對(duì)核酸序列進(jìn)行分類(lèi)的模型方法,所述方法包括收集帶有準(zhǔn)確分類(lèi)標(biāo)簽的核酸序列構(gòu)建核酸序列數(shù)據(jù)庫(kù),將核酸序列數(shù)據(jù)庫(kù)中所有核酸序列分割成等長(zhǎng)度的短序列,從而形成短核酸序列均衡樣本,根據(jù)所述核酸序列數(shù)據(jù)庫(kù)中的核酸序列,提取核酸Kmer,形成核酸序列的Kmer字典;將短核酸序列均衡樣本轉(zhuǎn)化成數(shù)字信號(hào);使用數(shù)字信號(hào)訓(xùn)練一個(gè)能對(duì)核酸序列進(jìn)行多分類(lèi)的神經(jīng)網(wǎng)絡(luò)分類(lèi)器。通過(guò)本發(fā)明方法構(gòu)建的模型,能夠準(zhǔn)確快速地將待測(cè)核酸序列與數(shù)據(jù)庫(kù)中的核酸序列標(biāo)簽進(jìn)行對(duì)應(yīng)分類(lèi),并展示每個(gè)標(biāo)簽的可靠性分值,通過(guò)可靠性分值可以判定待檢測(cè)核酸序列是否由數(shù)據(jù)庫(kù)中的序列重組而成,或者根據(jù)同一樣本基因組上的不同核酸序列片段的檢測(cè)結(jié)果進(jìn)一步確定樣本的標(biāo)簽。 |
