一種新的工程機械租賃場景網(wǎng)頁文本關(guān)鍵內(nèi)容提取方法

基本信息

申請?zhí)?/td> CN202010344614.7 申請日 -
公開(公告)號 CN111538829B 公開(公告)日 2021-04-20
申請公布號 CN111538829B 申請公布日 2021-04-20
分類號 G06F40/284(2020.01)I;G06F16/951(2019.01)I;G06N3/08(2006.01)I;G06F16/34(2019.01)I;G06N3/04(2006.01)I;G06F16/958(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 楊婷婷;王藝;鄭龍 申請(專利權(quán))人 眾能聯(lián)合數(shù)字技術(shù)有限公司
代理機構(gòu) 南京眾聯(lián)專利代理有限公司 代理人 劉趁新
地址 210000江蘇省南京市雨花臺區(qū)寧雙路19號6號樓易司拓大廈6樓及701室
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種新的工程機械租賃場景網(wǎng)頁文本關(guān)鍵內(nèi)容提取方法,能夠不需要根據(jù)HTML標(biāo)簽解析不同網(wǎng)頁的內(nèi)容,利用YEDA中文文本標(biāo)注工具標(biāo)注出網(wǎng)頁中的機構(gòu)名,地名,日期,貨幣,數(shù)字,工程名,工程內(nèi)容,工程范圍,工程規(guī)模,所屬工程行業(yè),工程施工階段等信息,將標(biāo)注好的數(shù)據(jù)輸入到基于局部軟注意力機制的深度網(wǎng)絡(luò)模型中,在深度網(wǎng)絡(luò)模型中以LSTM作為基礎(chǔ)網(wǎng)絡(luò),同時在單詞級別,短語級別使用全局注意力機制,在句子級別使用局部注意力機制,從而使得提取的網(wǎng)頁關(guān)鍵性摘要信息可以讓人不用大量的閱覽網(wǎng)頁,快速獲取與工程租賃場景相關(guān)的感興趣內(nèi)容。??