一種客服對(duì)話聚類方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201610282670.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN107341157A | 公開(公告)日 | 2017-11-10 |
申請(qǐng)公布號(hào) | CN107341157A | 申請(qǐng)公布日 | 2017-11-10 |
分類號(hào) | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張凱;蔡寧;楊旭;付子豪 | 申請(qǐng)(專利權(quán))人 | 阿里巴巴(北京)軟件服務(wù)有限公司 |
代理機(jī)構(gòu) | 北京安信方達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李紅爽;凌齊文 |
地址 | 北京市朝陽區(qū)望京東園四區(qū)9號(hào)樓3層301號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)岢鲆环N客服對(duì)話聚類方法和裝置,包括:對(duì)收集到的原始語料按照預(yù)設(shè)類型進(jìn)行劃分,獲得每一類角色語料;對(duì)每一類所述角色語料分別進(jìn)行預(yù)處理,獲得每一類角色分詞語料;融合每一類所述角色分詞語料,進(jìn)行過濾停用詞處理,獲得過濾語料;對(duì)所述過濾語料進(jìn)行文本處理;對(duì)經(jīng)過文本處理后的所述過濾語料進(jìn)行聚類操作,本發(fā)明在保留了原始對(duì)話的信息基礎(chǔ)上,充分考慮了對(duì)話文本的不同參與者這一特性,對(duì)不同參與者進(jìn)行不同的處理,有效地提高了聚類的準(zhǔn)確性;在實(shí)際對(duì)話文本的聚類應(yīng)用中效果理想。 |
