一種基于統(tǒng)計機器學習方法的分詞字典數(shù)據(jù)采集方法

基本信息

申請?zhí)?/td> CN201610329755.5 申請日 -
公開(公告)號 CN106055560A 公開(公告)日 2016-10-26
申請公布號 CN106055560A 申請公布日 2016-10-26
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 姬江濤;閔新力;薛君志;馬偉華;秦玉林;張小坤;張國軍;施俊士;張余;程潔羚;周江;張達寧 申請(專利權)人 上海申騰信息技術有限公司
代理機構 上海三方專利事務所 代理人 上海申騰信息技術有限公司
地址 200040 上海市靜安區(qū)愚園路546號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及數(shù)據(jù)處理基礎領域,具體來說是一種基于統(tǒng)計機器學習方法的分詞字典數(shù)據(jù)采集方法,利用機器學習的方法,采用分類思想獲取領域概念,把領域概念獲取問題看成是一個二值分類問題,進行概念的獲取及處理,從而對采集信息或數(shù)據(jù)進行加工,建立信息數(shù)據(jù)庫和索引數(shù)據(jù)庫,形成用戶想要的數(shù)據(jù)內容,對用戶提出的各種檢索做出響應,為提供用戶所需的信息或相關指針,從而提高了信息檢索的準確率和準確率。