句子級(jí)用戶畫像生成方法、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110171840.4 申請(qǐng)日 -
公開(公告)號(hào) CN112989038A 公開(公告)日 2021-06-18
申請(qǐng)公布號(hào) CN112989038A 申請(qǐng)公布日 2021-06-18
分類號(hào) G06F16/35;G06F16/33;G06F40/289;G06F17/16 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐濤 申請(qǐng)(專利權(quán))人 浙江連信科技有限公司
代理機(jī)構(gòu) 北京知果之信知識(shí)產(chǎn)權(quán)代理有限公司 代理人 卜榮麗;李志剛
地址 310051 浙江省杭州市濱江區(qū)西興街道丹楓路399號(hào)3號(hào)樓901室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種句子級(jí)用戶畫像生成方法、裝置及存儲(chǔ)介質(zhì),包括:接收會(huì)話語料,基于爬蟲系統(tǒng)對(duì)所述會(huì)話語料進(jìn)行處理獲取目標(biāo)語料,其中目標(biāo)語料包括一個(gè)或多個(gè)文本;對(duì)文本進(jìn)行分詞處理,獲得每個(gè)文本分詞的詞向量,基于每個(gè)文本分詞的詞向量生成該文本的句向量;將句向量轉(zhuǎn)換為矩陣得到句矩陣,將句矩陣與句矩陣的轉(zhuǎn)置矩陣相乘得到交叉矩陣;基于TextRank算法對(duì)交叉矩陣進(jìn)行概率轉(zhuǎn)移矩陣圖分解,生成句子級(jí)用戶畫像。本發(fā)明能夠?qū)τ脩舢嬕跃渥拥男问竭M(jìn)行個(gè)體化、具體化、形象化等特征的描述。填補(bǔ)了詞級(jí)、大顆粒的群體標(biāo)簽對(duì)個(gè)體用戶心理畫像描述的缺失,通過人機(jī)會(huì)話的語料,實(shí)現(xiàn)對(duì)個(gè)體的心理訴求進(jìn)行畫像,細(xì)顆粒表示了個(gè)體用戶的訴求標(biāo)簽。