基于深度預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的中文醫(yī)療同義詞聚類(lèi)方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110301422.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113111180A | 公開(kāi)(公告)日 | 2021-07-13 |
申請(qǐng)公布號(hào) | CN113111180A | 申請(qǐng)公布日 | 2021-07-13 |
分類(lèi)號(hào) | G06F16/35(2019.01)I;G06F40/247(2020.01)I;G16H50/70(2018.01)I;G06N3/08(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王貴宣;曾令澤;王翔;謝鐘樂(lè);姚暢 | 申請(qǐng)(專(zhuān)利權(quán))人 | 杭州祺鯨科技有限公司 |
代理機(jī)構(gòu) | 杭州求是專(zhuān)利事務(wù)所有限公司 | 代理人 | 林超 |
地址 | 311215浙江省杭州市蕭山區(qū)寧圍街道利一路188號(hào)天人大廈 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于深度預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的中文醫(yī)療同義詞聚類(lèi)方法。1)將公開(kāi)的中文醫(yī)療數(shù)據(jù)集中的同義詞進(jìn)行分類(lèi)后構(gòu)建得到同義詞簇集C;2)基于步驟1)構(gòu)建的同義詞簇集C生成模型訓(xùn)練數(shù)據(jù)集:3)構(gòu)建set?instance神經(jīng)網(wǎng)絡(luò)模型;4)訓(xùn)練set?instance神經(jīng)網(wǎng)絡(luò)模型;5)使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對(duì)候選詞集進(jìn)行聚類(lèi),生成候選同義詞簇集。6)使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對(duì)候選同義詞簇集進(jìn)行合并,生成最終的同義詞簇集。本發(fā)明將先驗(yàn)知識(shí)通過(guò)預(yù)訓(xùn)練模型的形式引入到set?instance神經(jīng)網(wǎng)絡(luò)模型中,解決了詞匯缺乏上下文語(yǔ)境的問(wèn)題;此外,本發(fā)明可以利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對(duì)候選詞進(jìn)行聚類(lèi)操作。 |
