一種新聞主體識(shí)別方法、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010266045.9 申請(qǐng)日 -
公開(公告)號(hào) CN113496118A 公開(公告)日 2021-10-12
申請(qǐng)公布號(hào) CN113496118A 申請(qǐng)公布日 2021-10-12
分類號(hào) G06F40/242(2020.01)I;G06F40/279(2020.01)I;G06N20/10(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張佳旭;孔慶超;王婧宜;彭鑫;方省;張西娜;羅引;王磊 申請(qǐng)(專利權(quán))人 北京中科聞歌科技股份有限公司
代理機(jī)構(gòu) 北京華夏泰和知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張麗穎
地址 100028北京市海淀區(qū)北四環(huán)西路9號(hào)樓銀谷大廈7層0715室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種新聞主體識(shí)別方法、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。該方法包括:獲取待識(shí)別新聞文本,并對(duì)新聞文本進(jìn)行預(yù)處理;利用預(yù)設(shè)的分詞詞典,對(duì)預(yù)處理后的新聞文本執(zhí)行帶詞性標(biāo)注的分詞處理,得到多個(gè)被標(biāo)注詞性的分詞;在詞性被標(biāo)注為主體的分詞中查詢預(yù)設(shè)的目標(biāo)主體,并在新聞文本中提取目標(biāo)主體對(duì)應(yīng)的多種主體特征;將目標(biāo)主體對(duì)應(yīng)的多種主體特征輸入預(yù)先訓(xùn)練的主體識(shí)別模型中,獲取主體識(shí)別模型輸出的識(shí)別結(jié)果。在本發(fā)明中,將目標(biāo)主體對(duì)應(yīng)的多種主體特征作為主體識(shí)別模型的輸入,使主體識(shí)別模型根據(jù)目標(biāo)主體對(duì)應(yīng)的多種主體特征識(shí)別新聞文本的主體是否為目標(biāo)主體,彌補(bǔ)了新聞主體識(shí)別的技術(shù)空白。