一種基于用戶聊天記錄的標(biāo)簽挖掘方法及設(shè)備

基本信息

申請?zhí)?/td> CN202011556453.4 申請日 -
公開(公告)號 CN112287076B 公開(公告)日 2021-04-02
申請公布號 CN112287076B 申請公布日 2021-04-02
分類號 G06F16/33(2019.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I;G06F16/332(2019.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王清琛;張蹲;孟凡華;茆傳羽;杜振東;程云;張洪磊 申請(專利權(quán))人 南京云問網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) 南京瑞華騰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 錢麗
地址 211106江蘇省南京市江寧區(qū)勝利路89號紫金研創(chuàng)3棟302
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于用戶聊天記錄的標(biāo)簽挖掘方法及設(shè)備。該方法包括對通過語音助手與用戶閑聊生成的聊天數(shù)據(jù)進(jìn)行預(yù)處理,基于標(biāo)簽抽取模型和統(tǒng)計(jì)方法從預(yù)處理后的聊天數(shù)據(jù)中抽取用戶標(biāo)簽,基于關(guān)系發(fā)現(xiàn)模型挖掘相似度在設(shè)定閾值以上的所有標(biāo)簽。本發(fā)明借助神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法,使得模型可根據(jù)語義選擇合適的標(biāo)簽,標(biāo)簽效果好;當(dāng)系統(tǒng)運(yùn)行一段時(shí)間后會(huì)積累更多的用戶聊天數(shù)據(jù),可以再次進(jìn)行標(biāo)注訓(xùn)練來達(dá)到更好的效果,可支持進(jìn)一步優(yōu)化;本發(fā)明在經(jīng)過前期人工標(biāo)注后,后期可以自動(dòng)化抽取標(biāo)簽,節(jié)省了大量的人力,提升效率。??