一種基于命名實體識別提取短信文本摘要的方法及裝置

基本信息

申請?zhí)?/td> CN202010435221.7 申請日 -
公開(公告)號 CN111597813A 公開(公告)日 2020-08-28
申請公布號 CN111597813A 申請公布日 2020-08-28
分類號 G06F40/295(2020.01)I;G06F16/34(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 元方;唐小波;宋爭光;郭樂;郭盛楠 申請(專利權(quán))人 上海創(chuàng)藍云智信息科技股份有限公司
代理機構(gòu) 成都智言知識產(chǎn)權(quán)代理有限公司 代理人 胡文莉
地址 201600上海市松江區(qū)中創(chuàng)路68號19幢
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及文本信息識別技術(shù)領(lǐng)域,尤其是一種基于命名實體識別提取短信文本摘要的方法及裝置,包括下述步驟:S1.準(zhǔn)備待提取摘要的短信文本集合;S2.標(biāo)注短信文本集合,每條短信文本需要標(biāo)注兩部分,組織實體詞與產(chǎn)品實體詞;S3.收集短信文本的標(biāo)注數(shù)據(jù)進行AI模型訓(xùn)練;S4.當(dāng)S3的AI模型訓(xùn)練完成后對數(shù)據(jù)進行預(yù)測并識別;S5.將AI模型預(yù)測出的組織實體詞與產(chǎn)品實體詞作為短信文本的摘要。本發(fā)明能自動提取短信摘要;標(biāo)注數(shù)據(jù)簡單,只用標(biāo)記兩組詞即可;訓(xùn)練后的AI模型提取的短信文本摘要準(zhǔn)確性高且內(nèi)容簡潔,極大提高了短信文本審核的準(zhǔn)確率和效率。??