用于法院輿情語(yǔ)料提取的數(shù)據(jù)處理的方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110964722.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113609298A | 公開(kāi)(公告)日 | 2021-11-05 |
申請(qǐng)公布號(hào) | CN113609298A | 申請(qǐng)公布日 | 2021-11-05 |
分類(lèi)號(hào) | G06F16/35(2019.01)I;G06F40/211(2020.01)I;G06Q50/18(2012.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 吳云朝;杜向陽(yáng) | 申請(qǐng)(專(zhuān)利權(quán))人 | 南京擎盾信息科技有限公司 |
代理機(jī)構(gòu) | 北京知果之信知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 卜榮麗;李志剛 |
地址 | 210000江蘇省南京市雨花臺(tái)區(qū)安德門(mén)大街21號(hào)江蘇科技金融大廈2號(hào)樓2、3層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開(kāi)了一種用于法院輿情語(yǔ)料提取的數(shù)據(jù)處理的方法和裝置。該方法包括:通過(guò)對(duì)爬取的法院輿情數(shù)據(jù)進(jìn)行行業(yè)詞抽取,通過(guò)構(gòu)建句法依存樹(shù)及預(yù)設(shè)關(guān)鍵詞抽取規(guī)則,獲得法院行業(yè)關(guān)鍵詞數(shù)據(jù)集,通過(guò)部分經(jīng)人工標(biāo)注的輿情數(shù)據(jù)訓(xùn)練過(guò)程輿情分類(lèi)模型,通過(guò)過(guò)程輿情分類(lèi)模型對(duì)爬取得到的未標(biāo)注輿情數(shù)據(jù)進(jìn)行標(biāo)注,得到訓(xùn)練目標(biāo)輿情分類(lèi)模型的目標(biāo)輿情語(yǔ)料數(shù)據(jù)集,解決了現(xiàn)有技術(shù)中模型訓(xùn)練需要大量人工標(biāo)注的數(shù)據(jù)導(dǎo)致的標(biāo)注效率較低的技術(shù)問(wèn)題,從而有利于提高法院輿情語(yǔ)料提取效率,提高模型訓(xùn)練的效率。 |
