一種模型訓(xùn)練方法、中醫(yī)藥名識(shí)別方法、裝置及網(wǎng)絡(luò)模型
基本信息
申請(qǐng)?zhí)?/td> | CN202110233316.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112949310A | 公開(公告)日 | 2021-06-11 |
申請(qǐng)公布號(hào) | CN112949310A | 申請(qǐng)公布日 | 2021-06-11 |
分類號(hào) | G06F40/295;G16H50/70;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張發(fā)恩;劉雨微 | 申請(qǐng)(專利權(quán))人 | 創(chuàng)新奇智(上海)科技有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 余菲 |
地址 | 201900 上海市寶山區(qū)上大路668號(hào)1幢569N | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)涉及一種模型訓(xùn)練方法、中醫(yī)藥名識(shí)別方法、裝置及網(wǎng)絡(luò)模型,屬于計(jì)算機(jī)技術(shù)領(lǐng)域。該訓(xùn)練方法包括:獲取數(shù)據(jù)樣本集,并按照預(yù)設(shè)比例劃分為訓(xùn)練集和測(cè)試集,所述數(shù)據(jù)樣本集包括多份醫(yī)案,每份醫(yī)案中的每個(gè)字均按照命名實(shí)體規(guī)則進(jìn)行了標(biāo)注;利用所述訓(xùn)練集和所述測(cè)試集對(duì)網(wǎng)絡(luò)模型進(jìn)行迭代訓(xùn)練,得到訓(xùn)練好的命名實(shí)體識(shí)別模型,其中,所述網(wǎng)絡(luò)模型包括:在BERT模型的詞向量輸出層后順次連接的CNN層、LSTM層和CRF層。通過對(duì)BERT模型進(jìn)行改進(jìn),在其詞向量輸出層后順次連接的CNN層、LSTM層和CRF層,使得訓(xùn)練出的網(wǎng)絡(luò)模型能夠準(zhǔn)確的識(shí)別出不常用領(lǐng)域的專有名詞,解決了現(xiàn)有命名實(shí)體自動(dòng)識(shí)別方法存在的識(shí)別不準(zhǔn)確或識(shí)別錯(cuò)誤的問題。 |
