一種用于遺傳變異致病性打分的機器學(xué)習(xí)模型的構(gòu)建方法
基本信息
申請?zhí)?/td> | CN201711476028.2 | 申請日 | - |
公開(公告)號 | CN108108592A | 公開(公告)日 | 2018-06-01 |
申請公布號 | CN108108592A | 申請公布日 | 2018-06-01 |
分類號 | G06F19/24;G06F19/28 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王玉梅;劉軒竹;王樂珩;李廈戎 | 申請(專利權(quán))人 | 北京聚道科技有限公司 |
代理機構(gòu) | 北京華夏正合知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 北京聚道科技有限公司 |
地址 | 100191 北京市海淀區(qū)花園東路11號泰興大廈501 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種用于遺傳變異致病性打分的機器學(xué)習(xí)模型的構(gòu)建方法,包括:A、獲取變異數(shù)據(jù)文件,并將所述文件進行注釋;B、根據(jù)注釋后的信息篩選出每條變異數(shù)據(jù)的單轉(zhuǎn)錄本;C、對篩選后的單轉(zhuǎn)錄本中的數(shù)據(jù)進行數(shù)據(jù)分類平衡調(diào)整;D、對調(diào)整后的數(shù)據(jù)進行初始特征值的篩選;E、篩選后特征值中的非數(shù)值特征進行獨熱編碼量化;F、將獨熱編碼量化后的特征值中的缺失值進行填補;G、將填補后的特征值輸入到機器學(xué)習(xí)模型中進行訓(xùn)練,以獲取所述致病性機器學(xué)習(xí)模型。由上,本發(fā)明的機器學(xué)習(xí)模型可以獲取高精度、高召回率的打分結(jié)果。 |
