基于神經(jīng)網(wǎng)絡(luò)半監(jiān)督學(xué)習(xí)的互聯(lián)網(wǎng)大數(shù)據(jù)文本精準挖掘引擎
基本信息
申請?zhí)?/td> | CN201711057863.2 | 申請日 | - |
公開(公告)號 | CN109697225A | 公開(公告)日 | 2019-04-30 |
申請公布號 | CN109697225A | 申請公布日 | 2019-04-30 |
分類號 | G06F16/33(2019.01)I; G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 陳琳; 馬杲靈; 杜華飛; 任渝 | 申請(專利權(quán))人 | 貴州雙龍數(shù)聯(lián)科技有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 550002 貴州省貴陽市南明區(qū)龍洞堡電子商務(wù)港A棟2單元9層7號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明是一種基于神經(jīng)網(wǎng)絡(luò)半監(jiān)督學(xué)習(xí)的互聯(lián)網(wǎng)大數(shù)據(jù)文本精準挖掘引擎技術(shù),基于互聯(lián)網(wǎng)大數(shù)據(jù)服務(wù)平臺實現(xiàn),互聯(lián)網(wǎng)大數(shù)據(jù)服務(wù)平臺包括本地客戶端、文本精準挖掘系統(tǒng)與存儲數(shù)據(jù)庫;文本精準挖掘系統(tǒng)既網(wǎng)頁抓取系統(tǒng),能提取并判別實體對象,該方法具體包括以下步驟:1、網(wǎng)頁抓??;2、結(jié)構(gòu)化文本內(nèi)容;3、提取實體對象;4、計算實體對象屬于主題的概率;5、存儲入數(shù)據(jù)庫。利用基于互聯(lián)網(wǎng)大數(shù)據(jù)網(wǎng)頁內(nèi)容提取技術(shù),在識別網(wǎng)頁的同時快速抓取網(wǎng)頁信息、提取實體對象,實現(xiàn)對實體對象的快速判別,為大數(shù)據(jù)分析提供了保障,無需軟硬件資源,滿足了中小企業(yè)、個人用戶對大數(shù)據(jù)分析服務(wù)低成本、定向化和個性化的要求。 |
