問題去重方法、裝置、電子設(shè)備和計算機可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201910457996.1 申請日 -
公開(公告)號 CN110134777B 公開(公告)日 2021-11-26
申請公布號 CN110134777B 申請公布日 2021-11-26
分類號 G06F16/332;G06F16/35 分類 計算;推算;計數(shù);
發(fā)明人 王卓然;亓超;馬宇馳;陳華榮;秦海龍;郭偉 申請(專利權(quán))人 三角獸(北京)科技有限公司
代理機構(gòu) 北京市立方律師事務(wù)所 代理人 張筱寧
地址 518057 廣東省深圳市南山區(qū)高新區(qū)科技中一路騰訊大廈35層
法律狀態(tài) -

摘要

摘要 本申請實施例提供了一種問題去重方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)。該方法包括:對多個問題語料分別進行分詞操作得到每一問題語料對應(yīng)的多個問題詞匯,并基于第一數(shù)量的基礎(chǔ)問題語料計算各個問題詞匯的詞頻?逆文本頻率,基于各個問題語料分別對應(yīng)的多個問題詞匯的詞頻?逆文本頻率,對多個問題語料進行歸類處理,得到多個問題類別,基于各個問題類別分別對應(yīng)的至少一個問題語料,確定各個問題類別分別對應(yīng)的標準問題。本申請實施例實現(xiàn)了計算得到問題類別的數(shù)量,具有較高的準確性,進一步基于一個問題類別得到對應(yīng)的一個標準問題,能有效的針對大數(shù)量的問題進行去重處理。