一種用于遺傳變異致病性打分的機(jī)器學(xué)習(xí)模型的構(gòu)建方法

基本信息

申請(qǐng)?zhí)?/td> CN201711476028.2 申請(qǐng)日 -
公開(公告)號(hào) CN108108592B 公開(公告)日 2018-06-01
申請(qǐng)公布號(hào) CN108108592B 申請(qǐng)公布日 2018-06-01
分類號(hào) G16B20/20(2019.01)I;G16B40/00(2019.01)I 分類 -
發(fā)明人 王玉梅;劉軒竹;王樂(lè)珩;李廈戎 申請(qǐng)(專利權(quán))人 北京聚道科技有限公司
代理機(jī)構(gòu) 北京華夏正合知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京聚道科技有限公司
地址 100191北京市海淀區(qū)花園東路11號(hào)泰興大廈501
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種用于遺傳變異致病性打分的機(jī)器學(xué)習(xí)模型的構(gòu)建方法,包括:A、獲取變異數(shù)據(jù)文件,并將所述文件進(jìn)行注釋;B、根據(jù)注釋后的信息篩選出每條變異數(shù)據(jù)的單轉(zhuǎn)錄本;C、對(duì)篩選后的單轉(zhuǎn)錄本中的數(shù)據(jù)進(jìn)行數(shù)據(jù)分類平衡調(diào)整;D、對(duì)調(diào)整后的數(shù)據(jù)進(jìn)行初始特征值的篩選;E、篩選后特征值中的非數(shù)值特征進(jìn)行獨(dú)熱編碼量化;F、將獨(dú)熱編碼量化后的特征值中的缺失值進(jìn)行填補(bǔ);G、將填補(bǔ)后的特征值輸入到機(jī)器學(xué)習(xí)模型中進(jìn)行訓(xùn)練,以獲取所述致病性機(jī)器學(xué)習(xí)模型。由上,本發(fā)明的機(jī)器學(xué)習(xí)模型可以獲取高精度、高召回率的打分結(jié)果。??