基于分子語義向量的無監(jiān)督學(xué)習(xí)藥物虛擬篩選方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202010920613.2 申請日 -
公開(公告)號 CN112151127A 公開(公告)日 2020-12-29
申請公布號 CN112151127A 申請公布日 2020-12-29
分類號 G16C20/50(2019.01)I 分類 物理
發(fā)明人 牛張明;鄭雙佳;江熒輝 申請(專利權(quán))人 杭州德睿智藥科技有限公司
代理機構(gòu) 上海智晟知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 牛張明;韋德·門佩斯-史密斯;韋德 門佩斯 史密斯
地址 浙江省杭州市錢塘新區(qū)新加坡科技園15幢11樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于分子語義向量的無監(jiān)督學(xué)習(xí)藥物虛擬篩選方法,包括:建立預(yù)訓(xùn)練數(shù)據(jù)庫;構(gòu)建候選集數(shù)據(jù)庫D1;構(gòu)建目標化合物庫D2;對所述預(yù)訓(xùn)練數(shù)據(jù)庫、候選集數(shù)據(jù)庫D1和目標化合物庫D2進行數(shù)據(jù)預(yù)處理,將所述預(yù)訓(xùn)練數(shù)據(jù)庫、候選集數(shù)據(jù)庫D1和目標化合物庫D2中所有化合物轉(zhuǎn)換成適合機器學(xué)習(xí)的文件儲存格式的數(shù)據(jù)集;建立無監(jiān)督深度學(xué)習(xí)的小分子量化模型,并用預(yù)訓(xùn)練數(shù)據(jù)庫中的數(shù)據(jù)對量化模型進行預(yù)訓(xùn)練得到經(jīng)訓(xùn)練的量化模型;利用經(jīng)訓(xùn)練的量化模型對所述候選集數(shù)據(jù)庫D1和目標化合物庫D2中的數(shù)據(jù)進行量化,得到候選集量化結(jié)果矩陣Va和目標化合物庫量化結(jié)果矩陣Vb;利用空間向量相似度算法計算候選集量化結(jié)果矩陣Va和目標化合物庫量化結(jié)果矩陣Vb的相似度得分矩陣R;以及通過對相似度得分矩陣R中的結(jié)果進行綜合排序,挑選出候選集數(shù)據(jù)庫D1中綜合得分最高的前K個化合物。??