長(zhǎng)文本的輿情分類(lèi)優(yōu)化方法
基本信息
申請(qǐng)?zhí)?/td> | CN202111060615.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114153967A | 公開(kāi)(公告)日 | 2022-03-08 |
申請(qǐng)公布號(hào) | CN114153967A | 申請(qǐng)公布日 | 2022-03-08 |
分類(lèi)號(hào) | G06F16/35(2019.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 唐亮;曹特磊;趙偉 | 申請(qǐng)(專(zhuān)利權(quán))人 | 時(shí)趣互動(dòng)(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京智慧亮點(diǎn)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 史明罡 |
地址 | 100020北京市朝陽(yáng)區(qū)建國(guó)路118號(hào)4層401內(nèi)C11 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了長(zhǎng)文本的輿情分類(lèi)優(yōu)化方法,包括以下步驟:a.對(duì)輸入的文本先用傳統(tǒng)的bert微調(diào)后的模型進(jìn)行輿情判斷,對(duì)判斷為中性輿情的文本,再判斷該文本的長(zhǎng)度,是否超過(guò)設(shè)置的長(zhǎng)度閾值;b.不超過(guò)就維持原始的輿情判斷結(jié)果,超過(guò)則進(jìn)行更細(xì)致的輿情分析;c.將當(dāng)前文本同時(shí)分別發(fā)給預(yù)訓(xùn)練和微調(diào)后的bert模型,得到當(dāng)前文本中的各個(gè)字符在微調(diào)前后的語(yǔ)義向量。本申請(qǐng)中,利用bert模型在微調(diào)前后的字符語(yǔ)義的變化,將其應(yīng)用于針對(duì)長(zhǎng)文本的輿情分類(lèi)任務(wù)中;通過(guò)識(shí)別有輿情傾向的文本片段,減少整體被判斷為中性的概率,更好的識(shí)別出用戶(hù)的細(xì)節(jié)輿情傾向。 |
