結(jié)合分類(lèi)算法與非監(jiān)督算法的文本質(zhì)量控制方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202011578227.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112650837A | 公開(kāi)(公告)日 | 2021-04-13 |
申請(qǐng)公布號(hào) | CN112650837A | 申請(qǐng)公布日 | 2021-04-13 |
分類(lèi)號(hào) | G06F16/33;G06F16/35;G06F40/284 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 吳明平 | 申請(qǐng)(專(zhuān)利權(quán))人 | 上海風(fēng)秩科技有限公司 |
代理機(jī)構(gòu) | 青島清泰聯(lián)信知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 趙燕 |
地址 | 200232 上海市徐匯區(qū)龍?zhí)m路277號(hào)2號(hào)樓5樓5B04單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開(kāi)了一種結(jié)合分類(lèi)算法與非監(jiān)督算法的文本質(zhì)量控制方法及系統(tǒng),所述方法包括:收集文本數(shù)據(jù);過(guò)濾所述文本數(shù)據(jù)中的無(wú)關(guān)數(shù)據(jù),獲取過(guò)濾文本;刪除所述過(guò)濾文本中的通用噪聲數(shù)據(jù),獲取去噪文本;刪除所述去噪文本中的標(biāo)題黨數(shù)據(jù),并輸出文本質(zhì)量分。通過(guò)本申請(qǐng),可控制文本質(zhì)量,同時(shí)輸出文本質(zhì)量分。 |
