長(zhǎng)文本的輿情分類優(yōu)化方法
基本信息
申請(qǐng)?zhí)?/td> | CN202111060615.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114153967A | 公開(公告)日 | 2022-03-08 |
申請(qǐng)公布號(hào) | CN114153967A | 申請(qǐng)公布日 | 2022-03-08 |
分類號(hào) | G06F16/35(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 唐亮;曹特磊;趙偉 | 申請(qǐng)(專利權(quán))人 | 時(shí)趣互動(dòng)(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京智慧亮點(diǎn)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 史明罡 |
地址 | 100020北京市朝陽(yáng)區(qū)建國(guó)路118號(hào)4層401內(nèi)C11 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了長(zhǎng)文本的輿情分類優(yōu)化方法,包括以下步驟:a.對(duì)輸入的文本先用傳統(tǒng)的bert微調(diào)后的模型進(jìn)行輿情判斷,對(duì)判斷為中性輿情的文本,再判斷該文本的長(zhǎng)度,是否超過設(shè)置的長(zhǎng)度閾值;b.不超過就維持原始的輿情判斷結(jié)果,超過則進(jìn)行更細(xì)致的輿情分析;c.將當(dāng)前文本同時(shí)分別發(fā)給預(yù)訓(xùn)練和微調(diào)后的bert模型,得到當(dāng)前文本中的各個(gè)字符在微調(diào)前后的語(yǔ)義向量。本申請(qǐng)中,利用bert模型在微調(diào)前后的字符語(yǔ)義的變化,將其應(yīng)用于針對(duì)長(zhǎng)文本的輿情分類任務(wù)中;通過識(shí)別有輿情傾向的文本片段,減少整體被判斷為中性的概率,更好的識(shí)別出用戶的細(xì)節(jié)輿情傾向。 |
