一種提升金融風(fēng)險(xiǎn)防控領(lǐng)域輿情實(shí)體識(shí)別率的方法

基本信息

申請(qǐng)?zhí)?/td> CN202010550784.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111695346A 公開(kāi)(公告)日 2020-09-22
申請(qǐng)公布號(hào) CN111695346A 申請(qǐng)公布日 2020-09-22
分類號(hào) G06F40/279(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭杰文 申請(qǐng)(專利權(quán))人 廣州金融科技股份有限公司
代理機(jī)構(gòu) 新余市渝星知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 張瑜生
地址 511455廣東省廣州市南沙區(qū)海濱路171號(hào)南沙金融大廈11樓1101之一J41
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體是一種提升金融風(fēng)險(xiǎn)防控領(lǐng)域輿情實(shí)體識(shí)別率的方法,包括以下步驟:S1.收集通用領(lǐng)域語(yǔ)料,諸如百度百科,維基百科,人民日?qǐng)?bào)等,對(duì)語(yǔ)料中的通用實(shí)體進(jìn)行BIO標(biāo)簽標(biāo)注;S2.收集金融領(lǐng)域語(yǔ)料,只對(duì)語(yǔ)料中的金融簡(jiǎn)稱、金融新實(shí)體等專用實(shí)體進(jìn)行BIO標(biāo)簽標(biāo)注,不對(duì)通用實(shí)體進(jìn)行BIO標(biāo)注;S3.選取深度學(xué)習(xí)NLP預(yù)訓(xùn)練模型,諸如bert預(yù)訓(xùn)練模型等;S4.挑選適合NER任務(wù)的下游模型,諸如bilstm_crf模型等。本發(fā)明的有益效果為利用基于深度學(xué)習(xí)的方法,通過(guò)分別訓(xùn)練基于NLP預(yù)訓(xùn)練模型的通用領(lǐng)域NER模型和基于NLP預(yù)訓(xùn)練模型的專用領(lǐng)域NER模型,再將二者抽取結(jié)果進(jìn)行融合,從而提高金融領(lǐng)域輿情實(shí)體識(shí)別的抽取率。??