一種新的工程機械租賃場景網(wǎng)頁文本關(guān)鍵內(nèi)容提取方法
基本信息
申請?zhí)?/td> | CN202010344614.7 | 申請日 | - |
公開(公告)號 | CN111538829B | 公開(公告)日 | 2021-04-20 |
申請公布號 | CN111538829B | 申請公布日 | 2021-04-20 |
分類號 | G06F40/284(2020.01)I;G06F16/951(2019.01)I;G06N3/08(2006.01)I;G06F16/34(2019.01)I;G06N3/04(2006.01)I;G06F16/958(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 楊婷婷;王藝;鄭龍 | 申請(專利權(quán))人 | 眾能聯(lián)合數(shù)字技術(shù)有限公司 |
代理機構(gòu) | 南京眾聯(lián)專利代理有限公司 | 代理人 | 劉趁新 |
地址 | 210000江蘇省南京市雨花臺區(qū)寧雙路19號6號樓易司拓大廈6樓及701室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種新的工程機械租賃場景網(wǎng)頁文本關(guān)鍵內(nèi)容提取方法,能夠不需要根據(jù)HTML標(biāo)簽解析不同網(wǎng)頁的內(nèi)容,利用YEDA中文文本標(biāo)注工具標(biāo)注出網(wǎng)頁中的機構(gòu)名,地名,日期,貨幣,數(shù)字,工程名,工程內(nèi)容,工程范圍,工程規(guī)模,所屬工程行業(yè),工程施工階段等信息,將標(biāo)注好的數(shù)據(jù)輸入到基于局部軟注意力機制的深度網(wǎng)絡(luò)模型中,在深度網(wǎng)絡(luò)模型中以LSTM作為基礎(chǔ)網(wǎng)絡(luò),同時在單詞級別,短語級別使用全局注意力機制,在句子級別使用局部注意力機制,從而使得提取的網(wǎng)頁關(guān)鍵性摘要信息可以讓人不用大量的閱覽網(wǎng)頁,快速獲取與工程租賃場景相關(guān)的感興趣內(nèi)容。?? |
