句子級用戶畫像生成方法、裝置及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110171840.4 申請日 -
公開(公告)號 CN112989038B 公開(公告)日 2022-06-21
申請公布號 CN112989038B 申請公布日 2022-06-21
分類號 G06F16/35;G06F16/33;G06F40/289;G06F17/16 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐濤 申請(專利權(quán))人 浙江連信科技有限公司
代理機(jī)構(gòu) 北京知果之信知識產(chǎn)權(quán)代理有限公司 代理人 卜榮麗;李志剛
地址 310000 浙江省杭州市拱墅區(qū)新華路266號三樓3505室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種句子級用戶畫像生成方法、裝置及存儲介質(zhì),包括:接收會話語料,基于爬蟲系統(tǒng)對所述會話語料進(jìn)行處理獲取目標(biāo)語料,其中目標(biāo)語料包括一個或多個文本;對文本進(jìn)行分詞處理,獲得每個文本分詞的詞向量,基于每個文本分詞的詞向量生成該文本的句向量;將句向量轉(zhuǎn)換為矩陣得到句矩陣,將句矩陣與句矩陣的轉(zhuǎn)置矩陣相乘得到交叉矩陣;基于TextRank算法對交叉矩陣進(jìn)行概率轉(zhuǎn)移矩陣圖分解,生成句子級用戶畫像。本發(fā)明能夠?qū)τ脩舢嬕跃渥拥男问竭M(jìn)行個體化、具體化、形象化等特征的描述。填補(bǔ)了詞級、大顆粒的群體標(biāo)簽對個體用戶心理畫像描述的缺失,通過人機(jī)會話的語料,實(shí)現(xiàn)對個體的心理訴求進(jìn)行畫像,細(xì)顆粒表示了個體用戶的訴求標(biāo)簽。