一種熱點(diǎn)主題挖掘方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910762850.8 申請(qǐng)日 -
公開(公告)號(hào) CN110852085A 公開(公告)日 2020-02-28
申請(qǐng)公布號(hào) CN110852085A 申請(qǐng)公布日 2020-02-28
分類號(hào) G06F40/284 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉躍華 申請(qǐng)(專利權(quán))人 湖南正宇軟件技術(shù)開發(fā)有限公司
代理機(jī)構(gòu) 長沙智德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 湖南正宇軟件技術(shù)開發(fā)有限公司
地址 410000 湖南省長沙市高新開發(fā)區(qū)尖山路39號(hào)長沙中電軟件園一期5棟701
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種熱點(diǎn)主題挖掘方法和系統(tǒng),屬于信息技術(shù)領(lǐng)域。系統(tǒng)包括主題數(shù)據(jù)庫模塊、關(guān)鍵詞數(shù)據(jù)庫模塊、中文分詞模塊、中文名詞打分模塊、相似度分析模塊和綜合評(píng)分模塊。方法為數(shù)據(jù)對(duì)象的使用用戶審查數(shù)據(jù)對(duì)象,系統(tǒng)選擇中文分詞模塊對(duì)數(shù)據(jù)對(duì)象內(nèi)容進(jìn)行中文分詞,主題數(shù)據(jù)庫和關(guān)鍵詞數(shù)據(jù)庫,得到該數(shù)據(jù)對(duì)象所屬的主題和關(guān)鍵詞;同時(shí),相似度分析模塊通過數(shù)據(jù)對(duì)象數(shù)據(jù)庫計(jì)算數(shù)據(jù)對(duì)象之間的內(nèi)容相似度,綜合評(píng)分后,返回可合并的數(shù)據(jù)對(duì)象列表。本發(fā)明通過對(duì)數(shù)據(jù)對(duì)象內(nèi)容、主題和關(guān)鍵詞的判斷,迅速提取內(nèi)容相關(guān)度比較高的數(shù)據(jù)對(duì)象給用戶參考,效率與準(zhǔn)確率均有大幅提升。