金融領(lǐng)域輿情監(jiān)控中的事件抽取方法、裝置和計(jì)算機(jī)設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202011414476.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112507059A 公開(kāi)(公告)日 2021-03-16
申請(qǐng)公布號(hào) CN112507059A 申請(qǐng)公布日 2021-03-16
分類(lèi)號(hào) G06N3/04(2006.01)I;G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06F16/31(2019.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 宗天元;李煜;丑曉慧 申請(qǐng)(專利權(quán))人 上海深擎信息科技有限公司
代理機(jī)構(gòu) 長(zhǎng)沙國(guó)科天河知識(shí)產(chǎn)權(quán)代理有限公司 代理人 邱軼
地址 315000浙江省寧波市鎮(zhèn)海區(qū)福業(yè)街55號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種金融領(lǐng)域輿情監(jiān)控中的事件抽取方法、裝置和計(jì)算機(jī)設(shè)備。所述方法包括:從金融新聞文本中獲取樣本數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,得到樣本集;獲取預(yù)先設(shè)置的多個(gè)不同的事件抽取模型,根據(jù)樣本集通過(guò)K折交叉驗(yàn)證的方式對(duì)事件抽取模型進(jìn)行訓(xùn)練,得到每個(gè)事件抽取模型的K個(gè)事件抽取子模型;將待抽取文本進(jìn)行預(yù)處理后輸入每個(gè)事件抽取模型的K個(gè)事件抽取子模型,輸出待抽取文本對(duì)應(yīng)的預(yù)測(cè)文本ID、預(yù)測(cè)事件和預(yù)測(cè)實(shí)體,根據(jù)預(yù)測(cè)文本ID、預(yù)測(cè)事件和預(yù)測(cè)實(shí)體構(gòu)建三元組;采用投票方式對(duì)每個(gè)事件抽取模型的K個(gè)事件抽取子模型輸出的三元組進(jìn)行投票,確定真實(shí)三元組。采用本方法能夠減小累計(jì)誤差。??