基于深度預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的中文醫(yī)療同義詞聚類方法

基本信息

申請?zhí)?/td> CN202110301422.2 申請日 -
公開(公告)號 CN113111180B 公開(公告)日 2022-01-25
申請公布號 CN113111180B 申請公布日 2022-01-25
分類號 G06F16/35(2019.01)I;G06F40/247(2020.01)I;G16H50/70(2018.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王貴宣;曾令澤;王翔;謝鐘樂;姚暢 申請(專利權(quán))人 杭州祺鯨科技有限公司
代理機構(gòu) 杭州求是專利事務(wù)所有限公司 代理人 林超
地址 311215浙江省杭州市蕭山區(qū)寧圍街道利一路188號天人大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的中文醫(yī)療同義詞聚類方法。1)將公開的中文醫(yī)療數(shù)據(jù)集中的同義詞進行分類后構(gòu)建得到同義詞簇集C;2)基于步驟1)構(gòu)建的同義詞簇集C生成模型訓(xùn)練數(shù)據(jù)集:3)構(gòu)建set?instance神經(jīng)網(wǎng)絡(luò)模型;4)訓(xùn)練set?instance神經(jīng)網(wǎng)絡(luò)模型;5)使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對候選詞集進行聚類,生成候選同義詞簇集。6)使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對候選同義詞簇集進行合并,生成最終的同義詞簇集。本發(fā)明將先驗知識通過預(yù)訓(xùn)練模型的形式引入到set?instance神經(jīng)網(wǎng)絡(luò)模型中,解決了詞匯缺乏上下文語境的問題;此外,本發(fā)明可以利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對候選詞進行聚類操作。