術(shù)語識(shí)別方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201710868929.X 申請(qǐng)日 -
公開(公告)號(hào) CN107818080A 公開(公告)日 2018-03-20
申請(qǐng)公布號(hào) CN107818080A 申請(qǐng)公布日 2018-03-20
分類號(hào) G06F17/27;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 田亮;孫凡;武瓊 申請(qǐng)(專利權(quán))人 新譯信息科技(北京)有限公司
代理機(jī)構(gòu) 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 代理人 閔南燕;劉芳
地址 100102 北京市朝陽區(qū)望京東園四區(qū)7號(hào)樓綠地中心B座2005/2006室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種術(shù)語識(shí)別方法及裝置,通過獲取數(shù)據(jù)集,對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)處理,得到分詞詞集;對(duì)分詞詞集進(jìn)行訓(xùn)練,得到詞向量集合;將詞向量集合作為輸入,輸入到包含至少3層結(jié)構(gòu)的預(yù)設(shè)模型中;其中,預(yù)設(shè)模型包括:窗口層、至少一層隱藏層、輸出層;詞向量集合從窗口層輸入,經(jīng)過隱藏層對(duì)詞向量進(jìn)行特征抽取,并將抽取后的特征標(biāo)記在詞向量上,訓(xùn)練后得到帶有標(biāo)簽的詞向量。從而實(shí)現(xiàn)對(duì)未標(biāo)注語料的快速和準(zhǔn)確地識(shí)別,識(shí)別效率相較于現(xiàn)有技術(shù)中的CRF算法有所提升。