一種基于規(guī)則的人物屬性提取方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202111513303.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114169317A 公開(kāi)(公告)日 2022-03-11
申請(qǐng)公布號(hào) CN114169317A 申請(qǐng)公布日 2022-03-11
分類號(hào) G06F40/253(2020.01)I;G06F40/284(2020.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王善和;張勇;劉如夢(mèng) 申請(qǐng)(專利權(quán))人 海南港航控股有限公司
代理機(jī)構(gòu) 武漢華之喻知識(shí)產(chǎn)權(quán)代理有限公司 代理人 廖盈春;曹葆青
地址 570311海南省海口市濱海大道96號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于規(guī)則的人物屬性提取方法和系統(tǒng),屬于自然語(yǔ)言的信息提取技術(shù)領(lǐng)域,包括:對(duì)包含人物屬性信息的段落使用中文分詞器進(jìn)行分詞處理,得到所述段落包含的若干個(gè)人物屬性詞語(yǔ),并標(biāo)注各人物屬性詞語(yǔ)的詞性;將帶有詞性標(biāo)注的各人物屬性詞語(yǔ)使用空格進(jìn)行分割,得到輸入段落中所有人物屬性詞語(yǔ)與詞性的集合,并保存到一維數(shù)組中;遍歷一維數(shù)組中各人物屬性詞語(yǔ)的詞性,將其和人物屬性觸發(fā)詞匹配規(guī)則表進(jìn)行匹配,對(duì)匹配上的人物屬性詞語(yǔ),繼續(xù)匹配所述人物屬性詞語(yǔ)前后的觸發(fā)詞,若匹配成功,則對(duì)所述人物屬性詞語(yǔ)進(jìn)行提取,反之則不進(jìn)行提取。本發(fā)明提供一種簡(jiǎn)單、有效的人物屬性提取方法,降低了提取難度同時(shí)提高了提取效率。