術(shù)語識(shí)別方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201710868929.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN107818080A | 公開(公告)日 | 2018-03-20 |
申請(qǐng)公布號(hào) | CN107818080A | 申請(qǐng)公布日 | 2018-03-20 |
分類號(hào) | G06F17/27;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 田亮;孫凡;武瓊 | 申請(qǐng)(專利權(quán))人 | 新譯信息科技(北京)有限公司 |
代理機(jī)構(gòu) | 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 閔南燕;劉芳 |
地址 | 100102 北京市朝陽區(qū)望京東園四區(qū)7號(hào)樓綠地中心B座2005/2006室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種術(shù)語識(shí)別方法及裝置,通過獲取數(shù)據(jù)集,對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)處理,得到分詞詞集;對(duì)分詞詞集進(jìn)行訓(xùn)練,得到詞向量集合;將詞向量集合作為輸入,輸入到包含至少3層結(jié)構(gòu)的預(yù)設(shè)模型中;其中,預(yù)設(shè)模型包括:窗口層、至少一層隱藏層、輸出層;詞向量集合從窗口層輸入,經(jīng)過隱藏層對(duì)詞向量進(jìn)行特征抽取,并將抽取后的特征標(biāo)記在詞向量上,訓(xùn)練后得到帶有標(biāo)簽的詞向量。從而實(shí)現(xiàn)對(duì)未標(biāo)注語料的快速和準(zhǔn)確地識(shí)別,識(shí)別效率相較于現(xiàn)有技術(shù)中的CRF算法有所提升。 |
