文本有效信息的抽取方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201910430073.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110348003A | 公開(公告)日 | 2019-10-18 |
申請(qǐng)公布號(hào) | CN110348003A | 申請(qǐng)公布日 | 2019-10-18 |
分類號(hào) | G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 晉耀紅;李健銓;趙紅紅;陳夏飛 | 申請(qǐng)(專利權(quán))人 | 安徽省泰岳祥升軟件有限公司 |
代理機(jī)構(gòu) | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 逯長明;許偉群 |
地址 | 230088 安徽省合肥市高新區(qū)習(xí)友路3333號(hào)中國(合肥)國際智能語音產(chǎn)業(yè)園研發(fā)中心樓405-5室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝艘环N文本有效信息的抽取方法及裝置,其中,所述方法包括:確定預(yù)設(shè)抽取模板信息中的結(jié)構(gòu)化信息;在待抽取文本信息中確定第一抽取信息;確定所述預(yù)設(shè)抽取模板信息中非結(jié)構(gòu)化信息對(duì)應(yīng)的正則表達(dá)式;結(jié)合各所述正則表達(dá)式,確定所述待抽取文本信息中的第二抽取信息;利用自然語言處理工具和深度學(xué)習(xí)模型,確定所述待抽取文本信息中的第三抽取信息;生成最終抽取信息。本申請(qǐng)所提供的文本有效信息的抽取方法及裝置能夠通過遞進(jìn)式的抽取方法,針對(duì)不同的文本情況采用不同的抽取方法,不遺漏地抽取整體文本中的有效信息,進(jìn)而有效提高文本有效信息的抽取準(zhǔn)確率。 |
