基于深度預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的中文醫(yī)療同義詞聚類方法
基本信息
申請?zhí)?/td> | CN202110301422.2 | 申請日 | - |
公開(公告)號 | CN113111180B | 公開(公告)日 | 2022-01-25 |
申請公布號 | CN113111180B | 申請公布日 | 2022-01-25 |
分類號 | G06F16/35(2019.01)I;G06F40/247(2020.01)I;G16H50/70(2018.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王貴宣;曾令澤;王翔;謝鐘樂;姚暢 | 申請(專利權(quán))人 | 杭州祺鯨科技有限公司 |
代理機構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 林超 |
地址 | 311215浙江省杭州市蕭山區(qū)寧圍街道利一路188號天人大廈 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于深度預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的中文醫(yī)療同義詞聚類方法。1)將公開的中文醫(yī)療數(shù)據(jù)集中的同義詞進行分類后構(gòu)建得到同義詞簇集C;2)基于步驟1)構(gòu)建的同義詞簇集C生成模型訓(xùn)練數(shù)據(jù)集:3)構(gòu)建set?instance神經(jīng)網(wǎng)絡(luò)模型;4)訓(xùn)練set?instance神經(jīng)網(wǎng)絡(luò)模型;5)使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對候選詞集進行聚類,生成候選同義詞簇集。6)使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對候選同義詞簇集進行合并,生成最終的同義詞簇集。本發(fā)明將先驗知識通過預(yù)訓(xùn)練模型的形式引入到set?instance神經(jīng)網(wǎng)絡(luò)模型中,解決了詞匯缺乏上下文語境的問題;此外,本發(fā)明可以利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對候選詞進行聚類操作。 |
