基于彈性分布式數(shù)據(jù)模型的多維度信息提取方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202010034181.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN110851432A | 公開(kāi)(公告)日 | 2020-02-28 |
申請(qǐng)公布號(hào) | CN110851432A | 申請(qǐng)公布日 | 2020-02-28 |
分類(lèi)號(hào) | G06F16/215;G06F16/2458;G06F16/25;G06F16/28;G06F16/951 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 馮世偉;吳正好;李鎖在;韓鵬;劉濤;朱慧彤;閆永燦;席邵賓;張超超;胡堅(jiān)升;喬擁俊 | 申請(qǐng)(專(zhuān)利權(quán))人 | 中軟信息系統(tǒng)工程有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專(zhuān)利代理事務(wù)所(特殊普通合伙) | 代理人 | 中軟信息系統(tǒng)工程有限公司 |
地址 | 102209 北京市昌平區(qū)北七家鎮(zhèn)未來(lái)科技城南區(qū)中國(guó)電子信息安全技術(shù)研發(fā)基地 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┮环N基于彈性分布式數(shù)據(jù)模型的多維度信息提取方法及裝置,方法包括:獲取第一預(yù)設(shè)格式的數(shù)據(jù);利用彈性分布式數(shù)據(jù)模型對(duì)第一預(yù)設(shè)格式的數(shù)據(jù)進(jìn)行數(shù)據(jù)處理;將數(shù)據(jù)處理后的數(shù)據(jù)依據(jù)維度進(jìn)行數(shù)據(jù)標(biāo)注;根據(jù)數(shù)據(jù)標(biāo)注的結(jié)果生成數(shù)據(jù)維度表,以完成對(duì)第一預(yù)設(shè)格式的數(shù)據(jù)的信息提取。因此,可以根據(jù)網(wǎng)頁(yè)數(shù)據(jù)以及業(yè)務(wù)數(shù)據(jù)得到第一預(yù)設(shè)格式的數(shù)據(jù),然后利用彈性分布式數(shù)據(jù)模型對(duì)上述數(shù)據(jù)進(jìn)行數(shù)據(jù)處理最終實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)數(shù)據(jù)以及業(yè)務(wù)數(shù)據(jù)的信息提取。其中,利用彈性分布式數(shù)據(jù)模型進(jìn)行信息提取時(shí),可以對(duì)海量的數(shù)據(jù)進(jìn)行操作,從而增加信息提取的工作效率;同時(shí),具有強(qiáng)大的復(fù)原能力,可以實(shí)現(xiàn)多維度的信息提取,從而充分展示數(shù)據(jù)之間的關(guān)聯(lián)性。 |
