一種用于遺傳變異致病性打分的機器學(xué)習(xí)模型的構(gòu)建方法

基本信息

申請?zhí)?/td> CN201711476028.2 申請日 -
公開(公告)號 CN108108592A 公開(公告)日 2018-06-01
申請公布號 CN108108592A 申請公布日 2018-06-01
分類號 G06F19/24;G06F19/28 分類 計算;推算;計數(shù);
發(fā)明人 王玉梅;劉軒竹;王樂珩;李廈戎 申請(專利權(quán))人 北京聚道科技有限公司
代理機構(gòu) 北京華夏正合知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京聚道科技有限公司
地址 100191 北京市海淀區(qū)花園東路11號泰興大廈501
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種用于遺傳變異致病性打分的機器學(xué)習(xí)模型的構(gòu)建方法,包括:A、獲取變異數(shù)據(jù)文件,并將所述文件進行注釋;B、根據(jù)注釋后的信息篩選出每條變異數(shù)據(jù)的單轉(zhuǎn)錄本;C、對篩選后的單轉(zhuǎn)錄本中的數(shù)據(jù)進行數(shù)據(jù)分類平衡調(diào)整;D、對調(diào)整后的數(shù)據(jù)進行初始特征值的篩選;E、篩選后特征值中的非數(shù)值特征進行獨熱編碼量化;F、將獨熱編碼量化后的特征值中的缺失值進行填補;G、將填補后的特征值輸入到機器學(xué)習(xí)模型中進行訓(xùn)練,以獲取所述致病性機器學(xué)習(xí)模型。由上,本發(fā)明的機器學(xué)習(xí)模型可以獲取高精度、高召回率的打分結(jié)果。