一種基于統(tǒng)計機器學習方法的分詞字典數(shù)據(jù)采集方法
基本信息
申請?zhí)?/td> | CN201610329755.5 | 申請日 | - |
公開(公告)號 | CN106055560A | 公開(公告)日 | 2016-10-26 |
申請公布號 | CN106055560A | 申請公布日 | 2016-10-26 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 姬江濤;閔新力;薛君志;馬偉華;秦玉林;張小坤;張國軍;施俊士;張余;程潔羚;周江;張達寧 | 申請(專利權)人 | 上海申騰信息技術有限公司 |
代理機構 | 上海三方專利事務所 | 代理人 | 上海申騰信息技術有限公司 |
地址 | 200040 上海市靜安區(qū)愚園路546號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及數(shù)據(jù)處理基礎領域,具體來說是一種基于統(tǒng)計機器學習方法的分詞字典數(shù)據(jù)采集方法,利用機器學習的方法,采用分類思想獲取領域概念,把領域概念獲取問題看成是一個二值分類問題,進行概念的獲取及處理,從而對采集信息或數(shù)據(jù)進行加工,建立信息數(shù)據(jù)庫和索引數(shù)據(jù)庫,形成用戶想要的數(shù)據(jù)內容,對用戶提出的各種檢索做出響應,為提供用戶所需的信息或相關指針,從而提高了信息檢索的準確率和準確率。 |
