問題去重方法、裝置、電子設(shè)備和計算機可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN201910457996.1 | 申請日 | - |
公開(公告)號 | CN110134777B | 公開(公告)日 | 2021-11-26 |
申請公布號 | CN110134777B | 申請公布日 | 2021-11-26 |
分類號 | G06F16/332;G06F16/35 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王卓然;亓超;馬宇馳;陳華榮;秦海龍;郭偉 | 申請(專利權(quán))人 | 三角獸(北京)科技有限公司 |
代理機構(gòu) | 北京市立方律師事務(wù)所 | 代理人 | 張筱寧 |
地址 | 518057 廣東省深圳市南山區(qū)高新區(qū)科技中一路騰訊大廈35層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請實施例提供了一種問題去重方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)。該方法包括:對多個問題語料分別進行分詞操作得到每一問題語料對應(yīng)的多個問題詞匯,并基于第一數(shù)量的基礎(chǔ)問題語料計算各個問題詞匯的詞頻?逆文本頻率,基于各個問題語料分別對應(yīng)的多個問題詞匯的詞頻?逆文本頻率,對多個問題語料進行歸類處理,得到多個問題類別,基于各個問題類別分別對應(yīng)的至少一個問題語料,確定各個問題類別分別對應(yīng)的標準問題。本申請實施例實現(xiàn)了計算得到問題類別的數(shù)量,具有較高的準確性,進一步基于一個問題類別得到對應(yīng)的一個標準問題,能有效的針對大數(shù)量的問題進行去重處理。 |
