基于詞性組合的新聞熱點(diǎn)提取方法、系統(tǒng)及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201910120240.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN109977397A | 公開(kāi)(公告)日 | 2019-07-05 |
申請(qǐng)公布號(hào) | CN109977397A | 申請(qǐng)公布日 | 2019-07-05 |
分類(lèi)號(hào) | G06F17/27(2006.01)I; G06K9/62(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 羅嘉惠; 白云龍; 唐昊; 魏延峰 | 申請(qǐng)(專(zhuān)利權(quán))人 | 廣州市誠(chéng)毅科技軟件開(kāi)發(fā)有限公司 |
代理機(jī)構(gòu) | 廣州嘉權(quán)專(zhuān)利商標(biāo)事務(wù)所有限公司 | 代理人 | 胡輝 |
地址 | 510300 廣東省廣州市廣州大道南368號(hào)26樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了基于詞性組合的新聞熱點(diǎn)提取方法、系統(tǒng)及存儲(chǔ)介質(zhì),方法包括:對(duì)新聞標(biāo)題集進(jìn)行第一分詞處理,生成第一詞集;根據(jù)第一詞集對(duì)新聞標(biāo)題集進(jìn)行第一文本匹配,生成目標(biāo)標(biāo)題集;對(duì)目標(biāo)標(biāo)題集進(jìn)行第二分詞處理,生成第二詞集;將第一詞集中的每個(gè)名詞進(jìn)行兩兩對(duì)比,并將第一詞集中每個(gè)名詞對(duì)應(yīng)的第二詞集中的非名詞詞性的詞語(yǔ)序列進(jìn)行兩兩對(duì)比,生成第一關(guān)鍵詞單元集;對(duì)第一關(guān)鍵詞單元集進(jìn)行聚類(lèi)處理,生成第二關(guān)鍵詞單元集;根據(jù)第二關(guān)鍵詞單元集對(duì)新聞標(biāo)題集進(jìn)行第二文本匹配,識(shí)別得到熱點(diǎn)新聞標(biāo)題。本發(fā)明的計(jì)算復(fù)雜度低且識(shí)別精度高,可廣泛應(yīng)用于文字處理技術(shù)領(lǐng)域。 |
