一種文本結(jié)構(gòu)化方法、文本結(jié)構(gòu)化裝置及終端設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202010543935.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111859968A | 公開(公告)日 | 2020-10-30 |
申請(qǐng)公布號(hào) | CN111859968A | 申請(qǐng)公布日 | 2020-10-30 |
分類號(hào) | G06F40/295(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳國(guó);楊鳳玲;魏政 | 申請(qǐng)(專利權(quán))人 | 深圳航天科創(chuàng)實(shí)業(yè)有限公司 |
代理機(jī)構(gòu) | 深圳中一聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 深圳航天科創(chuàng)實(shí)業(yè)有限公司 |
地址 | 518000廣東省深圳市南山區(qū)學(xué)苑大道1001號(hào)南山智園A5棟15層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)適用于自然語言處理技術(shù)領(lǐng)域,提供了一種文本結(jié)構(gòu)化方法、文本結(jié)構(gòu)化裝置及終端設(shè)備,所述方法包括:對(duì)待處理文本進(jìn)行分詞,得到詞語序列,所述詞語序列中包括至少一個(gè)詞語;對(duì)所述詞語序列中的各個(gè)詞語進(jìn)行詞性標(biāo)注,得到各個(gè)詞語的詞性;對(duì)所述待處理文本進(jìn)行命名實(shí)體識(shí)別,得到命名實(shí)體序列,所述命名實(shí)體序列中包括至少一個(gè)命名實(shí)體;對(duì)所述命名實(shí)體序列中的各個(gè)命名實(shí)體進(jìn)行語義角色標(biāo)注,得到語義角色標(biāo)注結(jié)果;根據(jù)所述詞語序列、各個(gè)詞語的詞性、所述命名實(shí)體序列和所述語義角色標(biāo)注結(jié)果,對(duì)所述待處理文本進(jìn)行結(jié)構(gòu)化處理,得到結(jié)構(gòu)化文本。通過上述方法,可以在非結(jié)構(gòu)化文本中發(fā)現(xiàn)關(guān)鍵信息,并將這些關(guān)鍵信息進(jìn)行結(jié)構(gòu)化。?? |
