用戶地理信息分析與文本挖掘方法和裝置
基本信息
申請?zhí)?/td> | CN201910515695.X | 申請日 | - |
公開(公告)號 | CN110209771A | 公開(公告)日 | 2019-09-06 |
申請公布號 | CN110209771A | 申請公布日 | 2019-09-06 |
分類號 | G06F16/33;G06F16/31 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 不公告發(fā)明人 | 申請(專利權(quán))人 | 哈爾濱哈銀消費金融有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京細(xì)軟智谷知識產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 劉冬梅 |
地址 | 150000 黑龍江省哈爾濱市道里區(qū)群力第四大道1536號A1棟1層4號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于自然語言處理的用戶地理信息分析與文本挖掘研究方法和裝置,該方法包括:獲取輸入的地址語句;若地址語句為英文地址語句,則進(jìn)行分詞處理,獲取英文地址語句的詞向量,根據(jù)預(yù)先構(gòu)造的翻譯詞典,對詞向量中的每個詞元素進(jìn)行翻譯,以將每個詞元素轉(zhuǎn)換成對應(yīng)的中文詞匯的拼音字符串;針對拼音字符串,根據(jù)預(yù)先計算的詞元素索引向量生成對應(yīng)的權(quán)值分配規(guī)則,以確定權(quán)值向量;根據(jù)權(quán)值向量和詞元素的存在性向量,計算任意兩個地址語句的相似度,以確定目標(biāo)地址語句;應(yīng)用目標(biāo)地址語句,分析用戶地理信息和挖掘?qū)?yīng)的文本信息。這樣能夠充分分析用戶地理信息分析進(jìn)而充分反應(yīng)用戶的社群特征。 |
