金融領(lǐng)域輿情監(jiān)控中的事件抽取方法、裝置和計(jì)算機(jī)設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202011414476.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112507059A | 公開(kāi)(公告)日 | 2021-03-16 |
申請(qǐng)公布號(hào) | CN112507059A | 申請(qǐng)公布日 | 2021-03-16 |
分類(lèi)號(hào) | G06N3/04(2006.01)I;G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06F16/31(2019.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 宗天元;李煜;丑曉慧 | 申請(qǐng)(專利權(quán))人 | 上海深擎信息科技有限公司 |
代理機(jī)構(gòu) | 長(zhǎng)沙國(guó)科天河知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 邱軼 |
地址 | 315000浙江省寧波市鎮(zhèn)海區(qū)福業(yè)街55號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)涉及一種金融領(lǐng)域輿情監(jiān)控中的事件抽取方法、裝置和計(jì)算機(jī)設(shè)備。所述方法包括:從金融新聞文本中獲取樣本數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,得到樣本集;獲取預(yù)先設(shè)置的多個(gè)不同的事件抽取模型,根據(jù)樣本集通過(guò)K折交叉驗(yàn)證的方式對(duì)事件抽取模型進(jìn)行訓(xùn)練,得到每個(gè)事件抽取模型的K個(gè)事件抽取子模型;將待抽取文本進(jìn)行預(yù)處理后輸入每個(gè)事件抽取模型的K個(gè)事件抽取子模型,輸出待抽取文本對(duì)應(yīng)的預(yù)測(cè)文本ID、預(yù)測(cè)事件和預(yù)測(cè)實(shí)體,根據(jù)預(yù)測(cè)文本ID、預(yù)測(cè)事件和預(yù)測(cè)實(shí)體構(gòu)建三元組;采用投票方式對(duì)每個(gè)事件抽取模型的K個(gè)事件抽取子模型輸出的三元組進(jìn)行投票,確定真實(shí)三元組。采用本方法能夠減小累計(jì)誤差。?? |
