網(wǎng)頁正文的提取方法、裝置、服務(wù)器和存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN201911329406.3 | 申請日 | - |
公開(公告)號 | CN111061955A | 公開(公告)日 | 2020-04-24 |
申請公布號 | CN111061955A | 申請公布日 | 2020-04-24 |
分類號 | G06F16/9535;G06F16/9538 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 方志杰;房海灝;熊興文 | 申請(專利權(quán))人 | 深圳市朱墨科技有限公司 |
代理機構(gòu) | 北京品源專利代理有限公司 | 代理人 | 深圳市朱墨科技有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)南區(qū)科技南十二路金蝶軟件園B棟603室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供了一種網(wǎng)頁正文的提取方法、裝置、服務(wù)器和存儲介質(zhì)。該網(wǎng)頁正文的提取方法包括:接收用戶輸入的查詢關(guān)鍵字;基于搜索引擎對所述查詢關(guān)鍵字進行查詢,得到所述查詢關(guān)鍵字對應(yīng)的查詢結(jié)果,所述查詢結(jié)果包括摘要信息和詳情頁信息;基于多個提取引擎對所述詳情頁信息進行提取,得到多個正文文本,每個正文文本對應(yīng)一個提取引擎;基于所述摘要信息和所述多個正文文本的匹配關(guān)系,在所述多個正文文本中確定目標正文文本。通過使用多個提取引擎提取正文文本,再確定目標正文文本,達到獲取高質(zhì)量的正文信息,提高正文信息內(nèi)容的準確性的效果。 |
