一種點(diǎn)評(píng)文本標(biāo)簽的自動(dòng)提取方案

基本信息

申請(qǐng)?zhí)?/td> CN202110166250.2 申請(qǐng)日 -
公開(公告)號(hào) CN112800180A 公開(公告)日 2021-05-14
申請(qǐng)公布號(hào) CN112800180A 申請(qǐng)公布日 2021-05-14
分類號(hào) G06F16/33;G06F16/35;G06F40/279;G06F40/30;G06N3/04;G06N3/08;G06N7/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 岑袁京 申請(qǐng)(專利權(quán))人 北京易車互聯(lián)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京棘龍知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李改平
地址 100089 北京市海淀區(qū)首都體育館南路6號(hào)新世紀(jì)飯店3號(hào)寫字樓十層D、E、F、G、H、J、單元
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種點(diǎn)評(píng)文本標(biāo)簽的自動(dòng)提取方案,包括分詞模塊:對(duì)點(diǎn)評(píng)文本進(jìn)行分詞;詞嵌入模型:根據(jù)海量文本訓(xùn)練處詞語(yǔ)的embedd i ng向量表示;情感極性模型:判斷文本的情感分類,以正向、負(fù)向、中性標(biāo)記;得出點(diǎn)評(píng)結(jié)果。本申請(qǐng)的有益效果是:使用了機(jī)器學(xué)習(xí)的方式,自動(dòng)化提取點(diǎn)評(píng)文本的文本標(biāo)簽,在保證正確性的基礎(chǔ)上大大減少了人工標(biāo)注的工作量,同時(shí)可挖掘詞語(yǔ)的內(nèi)在語(yǔ)義含義,通過(guò)對(duì)分散的文本標(biāo)簽進(jìn)行聚類,減少文本標(biāo)簽的類別數(shù),增強(qiáng)數(shù)據(jù)的準(zhǔn)確性,通過(guò)文本情感極性模型的引入,可以直觀地對(duì)文本進(jìn)行情感分類,并通過(guò)點(diǎn)評(píng)文本和標(biāo)簽文本的情感極性判斷,完善點(diǎn)評(píng)文本和標(biāo)簽文本的匹配效果。