結(jié)合分類(lèi)算法與非監(jiān)督算法的文本質(zhì)量控制方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202011578227.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112650837A 公開(kāi)(公告)日 2021-04-13
申請(qǐng)公布號(hào) CN112650837A 申請(qǐng)公布日 2021-04-13
分類(lèi)號(hào) G06F16/33;G06F16/35;G06F40/284 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳明平 申請(qǐng)(專(zhuān)利權(quán))人 上海風(fēng)秩科技有限公司
代理機(jī)構(gòu) 青島清泰聯(lián)信知識(shí)產(chǎn)權(quán)代理有限公司 代理人 趙燕
地址 200232 上海市徐匯區(qū)龍?zhí)m路277號(hào)2號(hào)樓5樓5B04單元
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種結(jié)合分類(lèi)算法與非監(jiān)督算法的文本質(zhì)量控制方法及系統(tǒng),所述方法包括:收集文本數(shù)據(jù);過(guò)濾所述文本數(shù)據(jù)中的無(wú)關(guān)數(shù)據(jù),獲取過(guò)濾文本;刪除所述過(guò)濾文本中的通用噪聲數(shù)據(jù),獲取去噪文本;刪除所述去噪文本中的標(biāo)題黨數(shù)據(jù),并輸出文本質(zhì)量分。通過(guò)本申請(qǐng),可控制文本質(zhì)量,同時(shí)輸出文本質(zhì)量分。