一種基于用戶聊天記錄的標(biāo)簽挖掘方法及設(shè)備

基本信息

申請?zhí)?/td> 2020115564534 申請日 -
公開(公告)號 CN112287076A 公開(公告)日 2021-01-29
申請公布號 CN112287076A 申請公布日 2021-01-29
分類號 G06F16/33(2019.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 王清琛;張蹲;孟凡華;茆傳羽;杜振東;程云;張洪磊 申請(專利權(quán))人 南京云問網(wǎng)絡(luò)技術(shù)有限公司
代理機構(gòu) 南京瑞華騰知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 錢麗
地址 211106江蘇省南京市江寧區(qū)勝利路89號紫金研創(chuàng)3棟302
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于用戶聊天記錄的標(biāo)簽挖掘方法及設(shè)備。該方法包括對通過語音助手與用戶閑聊生成的聊天數(shù)據(jù)進行預(yù)處理,基于標(biāo)簽抽取模型和統(tǒng)計方法從預(yù)處理后的聊天數(shù)據(jù)中抽取用戶標(biāo)簽,基于關(guān)系發(fā)現(xiàn)模型挖掘相似度在設(shè)定閾值以上的所有標(biāo)簽。本發(fā)明借助神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)方法,使得模型可根據(jù)語義選擇合適的標(biāo)簽,標(biāo)簽效果好;當(dāng)系統(tǒng)運行一段時間后會積累更多的用戶聊天數(shù)據(jù),可以再次進行標(biāo)注訓(xùn)練來達到更好的效果,可支持進一步優(yōu)化;本發(fā)明在經(jīng)過前期人工標(biāo)注后,后期可以自動化抽取標(biāo)簽,節(jié)省了大量的人力,提升效率。??