文本有效信息的抽取方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910430073.7 申請(qǐng)日 -
公開(公告)號(hào) CN110348003A 公開(公告)日 2019-10-18
申請(qǐng)公布號(hào) CN110348003A 申請(qǐng)公布日 2019-10-18
分類號(hào) G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 晉耀紅;李健銓;趙紅紅;陳夏飛 申請(qǐng)(專利權(quán))人 安徽省泰岳祥升軟件有限公司
代理機(jī)構(gòu) 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 逯長明;許偉群
地址 230088 安徽省合肥市高新區(qū)習(xí)友路3333號(hào)中國(合肥)國際智能語音產(chǎn)業(yè)園研發(fā)中心樓405-5室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N文本有效信息的抽取方法及裝置,其中,所述方法包括:確定預(yù)設(shè)抽取模板信息中的結(jié)構(gòu)化信息;在待抽取文本信息中確定第一抽取信息;確定所述預(yù)設(shè)抽取模板信息中非結(jié)構(gòu)化信息對(duì)應(yīng)的正則表達(dá)式;結(jié)合各所述正則表達(dá)式,確定所述待抽取文本信息中的第二抽取信息;利用自然語言處理工具和深度學(xué)習(xí)模型,確定所述待抽取文本信息中的第三抽取信息;生成最終抽取信息。本申請(qǐng)所提供的文本有效信息的抽取方法及裝置能夠通過遞進(jìn)式的抽取方法,針對(duì)不同的文本情況采用不同的抽取方法,不遺漏地抽取整體文本中的有效信息,進(jìn)而有效提高文本有效信息的抽取準(zhǔn)確率。