一種屬地網(wǎng)站醫(yī)藥內(nèi)容監(jiān)測方法
基本信息
申請?zhí)?/td> | CN202010280422.4 | 申請日 | - |
公開(公告)號 | CN111506791A | 公開(公告)日 | 2020-08-07 |
申請公布號 | CN111506791A | 申請公布日 | 2020-08-07 |
分類號 | G06F16/951;G06F16/182;G06F40/216;G06F40/289 | 分類 | - |
發(fā)明人 | 鄭中華;黎偉;胡淦;宣然 | 申請(專利權(quán))人 | 安徽博約信息科技股份有限公司 |
代理機構(gòu) | 合肥律眾知識產(chǎn)權(quán)代理有限公司 | 代理人 | 趙娟 |
地址 | 230000 安徽省合肥市高新區(qū)創(chuàng)新大道2800號創(chuàng)新產(chǎn)業(yè)園二期G3棟A區(qū)5-6層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種屬地網(wǎng)站醫(yī)藥內(nèi)容監(jiān)測方法,通過網(wǎng)絡(luò)爬蟲獲取屬地網(wǎng)站各網(wǎng)頁中的文本內(nèi)容,并對文本內(nèi)容進行違規(guī)醫(yī)藥信息判別,違規(guī)醫(yī)藥信息判別是將從屬地網(wǎng)站各網(wǎng)頁中獲取的文本內(nèi)容與醫(yī)藥信息語料庫中的數(shù)據(jù)進行比對統(tǒng)計,計算出該文本內(nèi)容屬于違規(guī)醫(yī)藥信息的命中率,若超出設(shè)定閾值,則判定為違規(guī)醫(yī)藥信息。本發(fā)明通過醫(yī)藥信息語料庫對從屬地網(wǎng)站各網(wǎng)頁中獲取的文本內(nèi)容進行比對統(tǒng)計分析,計算該文本內(nèi)容屬于違規(guī)醫(yī)藥信息的命中率,相比停留于關(guān)鍵詞判斷的監(jiān)測方法,違規(guī)醫(yī)藥信息命中準確率高,對于違規(guī)醫(yī)藥信息能夠做到快速識別。 |
