一種基于用戶聊天記錄的標(biāo)簽挖掘方法及設(shè)備
基本信息
申請?zhí)?/td> | 2020115564534 | 申請日 | - |
公開(公告)號 | CN112287076A | 公開(公告)日 | 2021-01-29 |
申請公布號 | CN112287076A | 申請公布日 | 2021-01-29 |
分類號 | G06F16/33(2019.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王清琛;張蹲;孟凡華;茆傳羽;杜振東;程云;張洪磊 | 申請(專利權(quán))人 | 南京云問網(wǎng)絡(luò)技術(shù)有限公司 |
代理機構(gòu) | 南京瑞華騰知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 錢麗 |
地址 | 211106江蘇省南京市江寧區(qū)勝利路89號紫金研創(chuàng)3棟302 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于用戶聊天記錄的標(biāo)簽挖掘方法及設(shè)備。該方法包括對通過語音助手與用戶閑聊生成的聊天數(shù)據(jù)進行預(yù)處理,基于標(biāo)簽抽取模型和統(tǒng)計方法從預(yù)處理后的聊天數(shù)據(jù)中抽取用戶標(biāo)簽,基于關(guān)系發(fā)現(xiàn)模型挖掘相似度在設(shè)定閾值以上的所有標(biāo)簽。本發(fā)明借助神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)方法,使得模型可根據(jù)語義選擇合適的標(biāo)簽,標(biāo)簽效果好;當(dāng)系統(tǒng)運行一段時間后會積累更多的用戶聊天數(shù)據(jù),可以再次進行標(biāo)注訓(xùn)練來達到更好的效果,可支持進一步優(yōu)化;本發(fā)明在經(jīng)過前期人工標(biāo)注后,后期可以自動化抽取標(biāo)簽,節(jié)省了大量的人力,提升效率。?? |
