一種文本挖掘方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110479541.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113239193A | 公開(kāi)(公告)日 | 2021-08-10 |
申請(qǐng)公布號(hào) | CN113239193A | 申請(qǐng)公布日 | 2021-08-10 |
分類號(hào) | G06F16/35(2019.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王露瑤;沈藝;陳述;鐘濤;張兵兵 | 申請(qǐng)(專利權(quán))人 | 深圳市云網(wǎng)萬(wàn)店科技有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 518001廣東省深圳市羅湖區(qū)東門(mén)街道城東社區(qū)深南東路2028號(hào)羅湖商務(wù)中心3510-131單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)涉及一種文本挖掘方法及系統(tǒng)。方法包括:接收用戶問(wèn)句向量,與已有語(yǔ)料進(jìn)行相似度判斷,根據(jù)判斷結(jié)果確定待聚類數(shù)據(jù);根據(jù)預(yù)設(shè)簇心列表,將所述待聚類數(shù)據(jù)生成與所述預(yù)設(shè)簇心列表對(duì)應(yīng)的簇;遍歷所有所述簇,分割包含多個(gè)用戶問(wèn)類別的簇,使每個(gè)所述簇對(duì)應(yīng)一個(gè)用戶問(wèn)類別;精簡(jiǎn)所有所述簇,合并包含同一意圖的所有簇;對(duì)比每個(gè)簇生成的結(jié)果,確定最優(yōu)聚類數(shù)據(jù)。本發(fā)明可以進(jìn)行文本向量化并對(duì)向量化后的文本進(jìn)行聚類,將所有相近的用戶問(wèn)歸納為新類別,擴(kuò)充原有機(jī)器人的語(yǔ)料類別,提升客服機(jī)器人的解決率。 |
