基于分子語義向量的無監(jiān)督學(xué)習(xí)藥物虛擬篩選方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN202010920613.2 | 申請日 | - |
公開(公告)號 | CN112151127A | 公開(公告)日 | 2020-12-29 |
申請公布號 | CN112151127A | 申請公布日 | 2020-12-29 |
分類號 | G16C20/50(2019.01)I | 分類 | 物理 |
發(fā)明人 | 牛張明;鄭雙佳;江熒輝 | 申請(專利權(quán))人 | 杭州德睿智藥科技有限公司 |
代理機構(gòu) | 上海智晟知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 牛張明;韋德·門佩斯-史密斯;韋德 門佩斯 史密斯 |
地址 | 浙江省杭州市錢塘新區(qū)新加坡科技園15幢11樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于分子語義向量的無監(jiān)督學(xué)習(xí)藥物虛擬篩選方法,包括:建立預(yù)訓(xùn)練數(shù)據(jù)庫;構(gòu)建候選集數(shù)據(jù)庫D1;構(gòu)建目標化合物庫D2;對所述預(yù)訓(xùn)練數(shù)據(jù)庫、候選集數(shù)據(jù)庫D1和目標化合物庫D2進行數(shù)據(jù)預(yù)處理,將所述預(yù)訓(xùn)練數(shù)據(jù)庫、候選集數(shù)據(jù)庫D1和目標化合物庫D2中所有化合物轉(zhuǎn)換成適合機器學(xué)習(xí)的文件儲存格式的數(shù)據(jù)集;建立無監(jiān)督深度學(xué)習(xí)的小分子量化模型,并用預(yù)訓(xùn)練數(shù)據(jù)庫中的數(shù)據(jù)對量化模型進行預(yù)訓(xùn)練得到經(jīng)訓(xùn)練的量化模型;利用經(jīng)訓(xùn)練的量化模型對所述候選集數(shù)據(jù)庫D1和目標化合物庫D2中的數(shù)據(jù)進行量化,得到候選集量化結(jié)果矩陣Va和目標化合物庫量化結(jié)果矩陣Vb;利用空間向量相似度算法計算候選集量化結(jié)果矩陣Va和目標化合物庫量化結(jié)果矩陣Vb的相似度得分矩陣R;以及通過對相似度得分矩陣R中的結(jié)果進行綜合排序,挑選出候選集數(shù)據(jù)庫D1中綜合得分最高的前K個化合物。?? |
