一種客服對(duì)話聚類方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201610282670.6 申請(qǐng)日 -
公開(公告)號(hào) CN107341157A 公開(公告)日 2017-11-10
申請(qǐng)公布號(hào) CN107341157A 申請(qǐng)公布日 2017-11-10
分類號(hào) G06F17/30(2006.01)I;G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張凱;蔡寧;楊旭;付子豪 申請(qǐng)(專利權(quán))人 阿里巴巴(北京)軟件服務(wù)有限公司
代理機(jī)構(gòu) 北京安信方達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李紅爽;凌齊文
地址 北京市朝陽區(qū)望京東園四區(qū)9號(hào)樓3層301號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)岢鲆环N客服對(duì)話聚類方法和裝置,包括:對(duì)收集到的原始語料按照預(yù)設(shè)類型進(jìn)行劃分,獲得每一類角色語料;對(duì)每一類所述角色語料分別進(jìn)行預(yù)處理,獲得每一類角色分詞語料;融合每一類所述角色分詞語料,進(jìn)行過濾停用詞處理,獲得過濾語料;對(duì)所述過濾語料進(jìn)行文本處理;對(duì)經(jīng)過文本處理后的所述過濾語料進(jìn)行聚類操作,本發(fā)明在保留了原始對(duì)話的信息基礎(chǔ)上,充分考慮了對(duì)話文本的不同參與者這一特性,對(duì)不同參與者進(jìn)行不同的處理,有效地提高了聚類的準(zhǔn)確性;在實(shí)際對(duì)話文本的聚類應(yīng)用中效果理想。