句子級用戶畫像生成方法、裝置及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110171840.4 | 申請日 | - |
公開(公告)號 | CN112989038B | 公開(公告)日 | 2022-06-21 |
申請公布號 | CN112989038B | 申請公布日 | 2022-06-21 |
分類號 | G06F16/35;G06F16/33;G06F40/289;G06F17/16 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 徐濤 | 申請(專利權(quán))人 | 浙江連信科技有限公司 |
代理機(jī)構(gòu) | 北京知果之信知識產(chǎn)權(quán)代理有限公司 | 代理人 | 卜榮麗;李志剛 |
地址 | 310000 浙江省杭州市拱墅區(qū)新華路266號三樓3505室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種句子級用戶畫像生成方法、裝置及存儲介質(zhì),包括:接收會話語料,基于爬蟲系統(tǒng)對所述會話語料進(jìn)行處理獲取目標(biāo)語料,其中目標(biāo)語料包括一個或多個文本;對文本進(jìn)行分詞處理,獲得每個文本分詞的詞向量,基于每個文本分詞的詞向量生成該文本的句向量;將句向量轉(zhuǎn)換為矩陣得到句矩陣,將句矩陣與句矩陣的轉(zhuǎn)置矩陣相乘得到交叉矩陣;基于TextRank算法對交叉矩陣進(jìn)行概率轉(zhuǎn)移矩陣圖分解,生成句子級用戶畫像。本發(fā)明能夠?qū)τ脩舢嬕跃渥拥男问竭M(jìn)行個體化、具體化、形象化等特征的描述。填補(bǔ)了詞級、大顆粒的群體標(biāo)簽對個體用戶心理畫像描述的缺失,通過人機(jī)會話的語料,實(shí)現(xiàn)對個體的心理訴求進(jìn)行畫像,細(xì)顆粒表示了個體用戶的訴求標(biāo)簽。 |
