尋找樣本的染色體突變位點的分析方法和分析裝置

基本信息

申請?zhí)?/td> CN201610782624.2 申請日 -
公開(公告)號 CN106407749A 公開(公告)日 2017-02-15
申請公布號 CN106407749A 申請公布日 2017-02-15
分類號 G06F19/20(2011.01)I 分類 計算;推算;計數;
發(fā)明人 陳晨;于偉文 申請(專利權)人 上海華點云生物科技有限公司
代理機構 北京邦信陽專利商標代理有限公司 代理人 上海華點云生物科技有限公司
地址 100025 北京市朝陽區(qū)慈云寺橋住邦2000,4號樓21層
法律狀態(tài) -

摘要

摘要 本發(fā)明的實施例公開了一種基于高通量測序數據尋找樣本的染色體突變位點的分析方法和裝置。所述方法包括:為并行計算做準備;通過并行計算過濾掉無效堿基;根據保留的堿基確定樣本的染色體突變位點。切分數據;生成執(zhí)行實體。將文件切分為文件塊;將從文件塊中讀取的數據切分為RDD并生成job。堿基不一致時,對此測序序列的每個堿基計算堿基比對質量值;在BAQ和測序質量值中取較小值作為最終質量值;該值小于第一閾值時過濾掉此堿基。統(tǒng)計樣本的每個位點突變堿基所占比率;該值大于等于第二閾值時,此位點為樣本的染色體突變位點。采用本發(fā)明的技術方案以后,大幅度提升了基于高通量測序數據尋找樣本的染色體突變位點的分析速度。