多倍體基因組同源染色體的拆分方法、裝置及其應(yīng)用

基本信息

申請(qǐng)?zhí)?/td> 2020111743639 申請(qǐng)日 -
公開(公告)號(hào) CN112289382A 公開(公告)日 2021-01-29
申請(qǐng)公布號(hào) CN112289382A 申請(qǐng)公布日 2021-01-29
分類號(hào) G16B30/20(2019.01)I; 分類 物理
發(fā)明人 李本萍;王璐;王迪;周勛;陶琳娜 申請(qǐng)(專利權(quán))人 天津諾禾致源生物信息科技有限公司
代理機(jī)構(gòu) 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 路秀麗
地址 301700天津市武清區(qū)武清開發(fā)區(qū)創(chuàng)業(yè)總部基地B07
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種多倍體基因組同源染色體的拆分方法、裝置及其應(yīng)用。其中拆分方法包括:根據(jù)HiC數(shù)據(jù)與多倍體基因組序列比對(duì)得到的比對(duì)文件,計(jì)算基因組重疊群間的互作強(qiáng)度和重疊群內(nèi)的互作強(qiáng)度;根據(jù)各重疊群內(nèi)的互作強(qiáng)度對(duì)連接錯(cuò)誤的重疊群進(jìn)行打斷;利用打斷后的重疊群進(jìn)行相互比對(duì),得到重疊群間的相似度;根據(jù)重疊群間的互作強(qiáng)度和重疊群間的相似度對(duì)所有重疊群進(jìn)行聚類,實(shí)現(xiàn)對(duì)多倍體基因組同源染色體的拆分。先通過利用重疊群內(nèi)的互作強(qiáng)度識(shí)別錯(cuò)誤連接的重疊群,并在錯(cuò)誤的地方進(jìn)行打斷。再通過識(shí)別重疊群間的相似性,利用重疊群間的互作強(qiáng)度和相似度高低進(jìn)行聚類,從而能夠有效的將同源染色體進(jìn)行拆分。??