長(zhǎng)文本的輿情分類優(yōu)化方法

基本信息

申請(qǐng)?zhí)?/td> CN202111060615.X 申請(qǐng)日 -
公開(公告)號(hào) CN114153967A 公開(公告)日 2022-03-08
申請(qǐng)公布號(hào) CN114153967A 申請(qǐng)公布日 2022-03-08
分類號(hào) G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 唐亮;曹特磊;趙偉 申請(qǐng)(專利權(quán))人 時(shí)趣互動(dòng)(北京)科技有限公司
代理機(jī)構(gòu) 北京智慧亮點(diǎn)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 史明罡
地址 100020北京市朝陽(yáng)區(qū)建國(guó)路118號(hào)4層401內(nèi)C11
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了長(zhǎng)文本的輿情分類優(yōu)化方法,包括以下步驟:a.對(duì)輸入的文本先用傳統(tǒng)的bert微調(diào)后的模型進(jìn)行輿情判斷,對(duì)判斷為中性輿情的文本,再判斷該文本的長(zhǎng)度,是否超過設(shè)置的長(zhǎng)度閾值;b.不超過就維持原始的輿情判斷結(jié)果,超過則進(jìn)行更細(xì)致的輿情分析;c.將當(dāng)前文本同時(shí)分別發(fā)給預(yù)訓(xùn)練和微調(diào)后的bert模型,得到當(dāng)前文本中的各個(gè)字符在微調(diào)前后的語(yǔ)義向量。本申請(qǐng)中,利用bert模型在微調(diào)前后的字符語(yǔ)義的變化,將其應(yīng)用于針對(duì)長(zhǎng)文本的輿情分類任務(wù)中;通過識(shí)別有輿情傾向的文本片段,減少整體被判斷為中性的概率,更好的識(shí)別出用戶的細(xì)節(jié)輿情傾向。