一種基于SQL的文本數(shù)據(jù)統(tǒng)計(jì)實(shí)現(xiàn)方法
基本信息
申請(qǐng)?zhí)?/td> | CN201510657159.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN105335479B | 公開(公告)日 | 2018-11-23 |
申請(qǐng)公布號(hào) | CN105335479B | 申請(qǐng)公布日 | 2018-11-23 |
分類號(hào) | G06F17/30 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王洋;蔣旭;陳訓(xùn)遜;趙殿奎;吳震;譚煒波;趙旭;李曉鵬 | 申請(qǐng)(專利權(quán))人 | 天津神舟通用數(shù)據(jù)技術(shù)有限公司 |
代理機(jī)構(gòu) | 天津盛理知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;天津神舟通用數(shù)據(jù)技術(shù)有限公司 |
地址 | 100029 北京市朝陽區(qū)裕民路甲3號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于SQL的文本數(shù)據(jù)統(tǒng)計(jì)實(shí)現(xiàn)方法,其技術(shù)特點(diǎn)是:對(duì)輸入SQL語法進(jìn)行解析;在結(jié)構(gòu)化數(shù)據(jù)倉庫中建立和子查詢投影結(jié)構(gòu)一致的臨時(shí)表;識(shí)別全文索引引擎數(shù)據(jù)分布規(guī)則;將基于SQL的簡(jiǎn)單子查詢翻譯為全文索引引擎語法,并在全文索引引擎中執(zhí)行;獲取全文索引查詢結(jié)果并將結(jié)果導(dǎo)入到結(jié)構(gòu)化數(shù)據(jù)倉庫引擎臨時(shí)表中;完成查詢結(jié)果導(dǎo)入過程,向數(shù)據(jù)倉庫下發(fā)重寫后的基于臨時(shí)表SQL查詢語句,并向客戶端返回查詢結(jié)果。本發(fā)明結(jié)合全文索引引擎和結(jié)構(gòu)化數(shù)據(jù)倉庫引擎的特點(diǎn),實(shí)現(xiàn)對(duì)海量文本數(shù)據(jù)的基于通用SQL語言的統(tǒng)計(jì)分析方法,解決了傳統(tǒng)方法統(tǒng)計(jì)功能薄弱和結(jié)構(gòu)化數(shù)據(jù)倉庫無法支持高效文本檢索的問題,大大提高了文本數(shù)據(jù)統(tǒng)計(jì)分析的易用性。 |
