一種基于文本摘要的政策要點(diǎn)抽取方法與提取系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110568578.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113032552A | 公開(kāi)(公告)日 | 2021-06-25 |
申請(qǐng)公布號(hào) | CN113032552A | 申請(qǐng)公布日 | 2021-06-25 |
分類(lèi)號(hào) | G06F16/34;G06F16/33;G06F16/35;G06F40/284;G06F40/30;G06N3/04;G06N3/08 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 麥丞程;仇學(xué)明;黃宜華;呂爽;周昌東 | 申請(qǐng)(專(zhuān)利權(quán))人 | 南京鴻程信息科技有限公司 |
代理機(jī)構(gòu) | 南京眾聯(lián)專(zhuān)利代理有限公司 | 代理人 | 許小莉 |
地址 | 211800 江蘇省南京市江北新區(qū)研創(chuàng)園團(tuán)結(jié)路99號(hào)騰飛大廈B座18樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于文本摘要的政策要點(diǎn)抽取方法與提取系統(tǒng)。本發(fā)明的方法包括如下步驟:S1.構(gòu)造政策要點(diǎn)抽取數(shù)據(jù)集,對(duì)政策數(shù)據(jù)集和解讀內(nèi)容進(jìn)行標(biāo)簽構(gòu)造;S2.抽取基于文本摘要的政策要點(diǎn),對(duì)政策要點(diǎn)數(shù)據(jù)集進(jìn)行抽取式文本摘要算法模型構(gòu)建;S3.基于關(guān)鍵單詞進(jìn)行候選政策要點(diǎn)抽取,通過(guò)對(duì)步驟S2中得到的候選政策要點(diǎn)通過(guò)關(guān)鍵詞進(jìn)行二次篩選,作為最終的政策要點(diǎn)抽取結(jié)果。本發(fā)明充分利用文本摘要技術(shù)解決政策服務(wù)領(lǐng)域的政策要點(diǎn)抽取難題。結(jié)合多任務(wù)學(xué)習(xí)框架,克服了現(xiàn)有抽取式文本摘要算法覆蓋不全和容易過(guò)擬合的問(wèn)題;基于關(guān)鍵單詞的候選政策要點(diǎn)抽取過(guò)程有助于在文本摘要的基礎(chǔ)上更進(jìn)一步的抽取政策文本的核心內(nèi)容。 |
