基于hash存儲的網(wǎng)絡(luò)詞匯語義分析方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201810917995.6 | 申請日 | - |
公開(公告)號 | CN109145297B | 公開(公告)日 | 2022-06-10 |
申請公布號 | CN109145297B | 申請公布日 | 2022-06-10 |
分類號 | G06F40/30(2020.01)I;G06F16/901(2019.01)I;G06F16/13(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張楠;謝彬;李程;劉立;佘平 | 申請(專利權(quán))人 | 華東計算技術(shù)研究所(中國電子科技集團公司第三十二研究所) |
代理機構(gòu) | 上海段和段律師事務(wù)所 | 代理人 | - |
地址 | 201800上海市嘉定區(qū)嘉羅路1485號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于Hash存儲的網(wǎng)絡(luò)詞匯語義分析方法和系統(tǒng),收集網(wǎng)絡(luò)詞匯,對所收集的網(wǎng)絡(luò)詞匯,收集對應(yīng)的傳統(tǒng)詞匯,依據(jù)所述網(wǎng)絡(luò)詞匯、傳統(tǒng)詞匯的一一對應(yīng)關(guān)系建立(key,value)對,其中key為網(wǎng)絡(luò)詞匯,value為傳統(tǒng)詞匯;確定Hash函數(shù),將所述(key,value)對根據(jù)Hash函數(shù)計算得出Hash函數(shù)值,按所述Hash函數(shù)值、所述(key,value)對存儲在Hash鏈表中;在Hash鏈表中查找所述網(wǎng)絡(luò)詞匯,并轉(zhuǎn)化為傳統(tǒng)詞匯;依據(jù)上下文的語義結(jié)構(gòu),結(jié)合貝葉斯定律,修正詞匯語義的二義性,判定所述詞匯是否是網(wǎng)絡(luò)詞匯。針對社交短文本中存在的大量網(wǎng)絡(luò)用語現(xiàn)象,快速準確定位社交短文本中的網(wǎng)絡(luò)用語。 |
