一種信息獲取方法和系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201910762979.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110851562A 公開(kāi)(公告)日 2020-02-28
申請(qǐng)公布號(hào) CN110851562A 申請(qǐng)公布日 2020-02-28
分類號(hào) G06F16/33;G06F16/335;G06F40/216;G06F40/289;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐藝 申請(qǐng)(專利權(quán))人 湖南正宇軟件技術(shù)開(kāi)發(fā)有限公司
代理機(jī)構(gòu) 長(zhǎng)沙智德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 湖南正宇軟件技術(shù)開(kāi)發(fā)有限公司
地址 410000 湖南省長(zhǎng)沙市高新開(kāi)發(fā)區(qū)尖山路39號(hào)長(zhǎng)沙中電軟件園一期5棟701
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種信息獲取方法和系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì),屬于信息技術(shù)領(lǐng)域。數(shù)據(jù)采集模塊、中文分詞模塊、中文名詞打分模塊、熱點(diǎn)提取模塊、內(nèi)容推薦模塊和相似度文檔推薦模塊,其中,數(shù)據(jù)采集模塊,用于定向抓取數(shù)據(jù)對(duì)象的文檔內(nèi)容,并發(fā)送給熱點(diǎn)提取模塊;中文分詞模塊,用于提取數(shù)據(jù)對(duì)象的文檔內(nèi)容中的中文名稱;中文名詞打分模塊,用于篩選數(shù)據(jù)對(duì)象的文檔內(nèi)容中的關(guān)鍵詞;熱點(diǎn)提取模塊,用于對(duì)數(shù)據(jù)對(duì)象的文檔內(nèi)容關(guān)鍵詞評(píng)分后提取涉及到的熱點(diǎn);內(nèi)容推薦模塊,用于推薦與數(shù)據(jù)對(duì)象關(guān)聯(lián)的內(nèi)容;相似度分析模塊,用于計(jì)算數(shù)據(jù)對(duì)象的文檔內(nèi)容之間的相似性。通過(guò)采集數(shù)據(jù)對(duì)象的文檔內(nèi)容信息,提取關(guān)鍵字、熱點(diǎn)及其之間的關(guān)聯(lián)性,有選擇的推薦文檔內(nèi)容給用戶,避免信息冗余。