句子級(jí)用戶畫像生成方法、裝置及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110171840.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112989038A | 公開(公告)日 | 2021-06-18 |
申請(qǐng)公布號(hào) | CN112989038A | 申請(qǐng)公布日 | 2021-06-18 |
分類號(hào) | G06F16/35;G06F16/33;G06F40/289;G06F17/16 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 徐濤 | 申請(qǐng)(專利權(quán))人 | 浙江連信科技有限公司 |
代理機(jī)構(gòu) | 北京知果之信知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 卜榮麗;李志剛 |
地址 | 310051 浙江省杭州市濱江區(qū)西興街道丹楓路399號(hào)3號(hào)樓901室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種句子級(jí)用戶畫像生成方法、裝置及存儲(chǔ)介質(zhì),包括:接收會(huì)話語料,基于爬蟲系統(tǒng)對(duì)所述會(huì)話語料進(jìn)行處理獲取目標(biāo)語料,其中目標(biāo)語料包括一個(gè)或多個(gè)文本;對(duì)文本進(jìn)行分詞處理,獲得每個(gè)文本分詞的詞向量,基于每個(gè)文本分詞的詞向量生成該文本的句向量;將句向量轉(zhuǎn)換為矩陣得到句矩陣,將句矩陣與句矩陣的轉(zhuǎn)置矩陣相乘得到交叉矩陣;基于TextRank算法對(duì)交叉矩陣進(jìn)行概率轉(zhuǎn)移矩陣圖分解,生成句子級(jí)用戶畫像。本發(fā)明能夠?qū)τ脩舢嬕跃渥拥男问竭M(jìn)行個(gè)體化、具體化、形象化等特征的描述。填補(bǔ)了詞級(jí)、大顆粒的群體標(biāo)簽對(duì)個(gè)體用戶心理畫像描述的缺失,通過人機(jī)會(huì)話的語料,實(shí)現(xiàn)對(duì)個(gè)體的心理訴求進(jìn)行畫像,細(xì)顆粒表示了個(gè)體用戶的訴求標(biāo)簽。 |
