智慧城市主題信息抽取方法、裝置、電子設備和存儲介質

基本信息

申請?zhí)?/td> CN202110642261.3 申請日 -
公開(公告)號 CN113297373A 公開(公告)日 2021-08-24
申請公布號 CN113297373A 申請公布日 2021-08-24
分類號 G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I;G06F17/16(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 楊楊;于海濤;高志鵬;趙斌男;王臻;趙龍軍;李恒;李良;冷超;高楓;陳奇柏 申請(專利權)人 中國雄安集團數(shù)字城市科技有限公司
代理機構 北京路浩知識產權代理有限公司 代理人 陳新生
地址 100876北京市海淀區(qū)西土城路10號北京郵電大學
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供一種智慧城市主題信息抽取方法、裝置、電子設備和存儲介質。該方法包括:將待抽取的智慧城市主題文本輸入至預訓練模型,輸出智慧城市主題文本特征矩陣;基于文本特征矩陣,確定頭實體位置特征矩陣和尾實體位置特征矩陣;其中,實體為被識別的目標單詞,頭實體位置特征矩陣和尾實體位置特征矩陣表示待抽取文本中單詞與實體的相對位置關系;基于頭實體位置特征矩陣和尾實體位置特征矩陣,確定面向智慧城市主題的簡潔文本特征矩陣;基于簡潔文本特征矩陣確定待抽取文本中的實體關系。本發(fā)明實施例通過將智慧城市主題的外部語料的絕對位置信息遷移至實體關系抽取具體任務,并通過降噪處理緩解噪聲與誤標注數(shù)據(jù)對模型參數(shù)更新的干擾,提升智慧城市知識圖譜的實體關系抽取精度。