一種從FASTQ文件中快速判斷樣本性別的方法
基本信息
申請?zhí)?/td> | CN202111149249.5 | 申請日 | - |
公開(公告)號 | CN113793641A | 公開(公告)日 | 2021-12-14 |
申請公布號 | CN113793641A | 申請公布日 | 2021-12-14 |
分類號 | G16B30/00 | 分類 | 物理 |
發(fā)明人 | 吳星辰;栗海波;梁萌萌;余偉師 | 申請(專利權(quán))人 | 蘇州賽美科基因科技有限公司 |
代理機構(gòu) | 北京同輝知識產(chǎn)權(quán)代理事務所(普通合伙) | 代理人 | 劉洪勛 |
地址 | 215100 江蘇省蘇州市相城區(qū)高鐵新城青龍港路58號天成時代商務廣場17層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種從FASTQ文件中快速判斷樣本性別的方法,包括:(1)根據(jù)參考基因組,生成Y染色體上特有的K?mer;(2)獲取全外顯子組測序捕獲探針的設計區(qū)間的交集,剔除在交集外的K?mer,將留存的K?mer以在捕獲探針的設計區(qū)間出現(xiàn)的次數(shù)從多到少的順序排列,選取靠前的K?mer作為特有K?mer集合;(3)隨機讀取FASTQ文件,對特有K?mer進行計數(shù),并使用相同男女數(shù)量的真實數(shù)據(jù)分析特有K?mer在不同性別FASTQ文件中的分布差異,確定性別判斷閾值;(4)根據(jù)閾值,對FASTQ文件進行性別判定。該方法適用于NGS的多種數(shù)據(jù)類型,分析流程簡單,操作方便,大大提高了判斷效率。 |
