一種文本結(jié)構(gòu)化方法、文本結(jié)構(gòu)化裝置及終端設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202010543935.X 申請(qǐng)日 -
公開(公告)號(hào) CN111859968A 公開(公告)日 2020-10-30
申請(qǐng)公布號(hào) CN111859968A 申請(qǐng)公布日 2020-10-30
分類號(hào) G06F40/295(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳國(guó);楊鳳玲;魏政 申請(qǐng)(專利權(quán))人 深圳航天科創(chuàng)實(shí)業(yè)有限公司
代理機(jī)構(gòu) 深圳中一聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 深圳航天科創(chuàng)實(shí)業(yè)有限公司
地址 518000廣東省深圳市南山區(qū)學(xué)苑大道1001號(hào)南山智園A5棟15層
法律狀態(tài) -

摘要

摘要 本申請(qǐng)適用于自然語言處理技術(shù)領(lǐng)域,提供了一種文本結(jié)構(gòu)化方法、文本結(jié)構(gòu)化裝置及終端設(shè)備,所述方法包括:對(duì)待處理文本進(jìn)行分詞,得到詞語序列,所述詞語序列中包括至少一個(gè)詞語;對(duì)所述詞語序列中的各個(gè)詞語進(jìn)行詞性標(biāo)注,得到各個(gè)詞語的詞性;對(duì)所述待處理文本進(jìn)行命名實(shí)體識(shí)別,得到命名實(shí)體序列,所述命名實(shí)體序列中包括至少一個(gè)命名實(shí)體;對(duì)所述命名實(shí)體序列中的各個(gè)命名實(shí)體進(jìn)行語義角色標(biāo)注,得到語義角色標(biāo)注結(jié)果;根據(jù)所述詞語序列、各個(gè)詞語的詞性、所述命名實(shí)體序列和所述語義角色標(biāo)注結(jié)果,對(duì)所述待處理文本進(jìn)行結(jié)構(gòu)化處理,得到結(jié)構(gòu)化文本。通過上述方法,可以在非結(jié)構(gòu)化文本中發(fā)現(xiàn)關(guān)鍵信息,并將這些關(guān)鍵信息進(jìn)行結(jié)構(gòu)化。??