一種自動清洗化學反應噪聲數(shù)據(jù)的方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202111214208.X 申請日 -
公開(公告)號 CN113886377A 公開(公告)日 2022-01-04
申請公布號 CN113886377A 申請公布日 2022-01-04
分類號 G06F16/215(2019.01)I;G16C20/10(2019.01)I;G16C20/70(2019.01)I;G16C20/90(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳慧敏;方什;陳德銘 申請(專利權(quán))人 上海藥明康德新藥開發(fā)有限公司
代理機構(gòu) 上海市匯業(yè)律師事務(wù)所 代理人 王函
地址 200131上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗區(qū)富特中路288號1號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種自動清洗化學反應噪聲數(shù)據(jù)的方法與系統(tǒng),方法包含獲取反應結(jié)構(gòu)式的數(shù)據(jù)集并進行標準化處理與去重得到預處理數(shù)據(jù);去掉預處理數(shù)據(jù)中所有多產(chǎn)物反應數(shù)據(jù),僅保留預處理數(shù)據(jù)中單產(chǎn)物反應數(shù)據(jù)進行訓練得到一個正向合成算法模型;取出預處理數(shù)據(jù)中多產(chǎn)物反應數(shù)據(jù)中的反應物輸入至正向合成算法模型中得到預測產(chǎn)物;判斷預測產(chǎn)物是否為多產(chǎn)物中任一個產(chǎn)物;是則將該多產(chǎn)物反應數(shù)據(jù)中的多產(chǎn)物替換成預測產(chǎn)物后加入到訓練數(shù)據(jù)集中;否則刪除;處理全部多產(chǎn)物反應數(shù)據(jù)得到清洗過的訓練數(shù)據(jù)集并訓練新正向模型;系統(tǒng)包含反應結(jié)構(gòu)式數(shù)據(jù)預處理模塊、正向合成算法模型訓練模塊、多產(chǎn)物反應數(shù)據(jù)預測模塊、判斷模塊、新的正向模型訓練模塊。