一種廣告識(shí)別方法及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201710980185.0 申請(qǐng)日 -
公開(公告)號(hào) CN107657286A 公開(公告)日 2018-02-02
申請(qǐng)公布號(hào) CN107657286A 申請(qǐng)公布日 2018-02-02
分類號(hào) G06K9/62;G06F17/27;G06F17/30;G06Q30/02 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 郭祥昊 申請(qǐng)(專利權(quán))人 北京深極智能科技有限公司
代理機(jī)構(gòu) 北京金咨知識(shí)產(chǎn)權(quán)代理有限公司 代理人 宋教花
地址 100041 北京市石景山區(qū)實(shí)興大街30號(hào)院3號(hào)樓2層B-0035房間
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種廣告識(shí)別方法及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該方法包括以下步驟:廣告識(shí)別步驟以及廣告庫更新步驟,廣告識(shí)別步驟包括:讀取非系統(tǒng)消息語料,以至少讀取用戶ID和語料內(nèi)容;將讀取的語料和廣告庫中的語料進(jìn)行相似度匹配,基于相似度匹配結(jié)果確定所述語料是否為廣告;廣告庫更新步驟包括:將被確定為非廣告的非系統(tǒng)消息語料加入到在線語料庫;獲取在線語料庫中存儲(chǔ)的多條語料的句子主干;基于獲取的句子主干出現(xiàn)的頻次以及用戶ID確定是否將句子主干放入廣告庫中,從而在確定放入廣告庫中的情況下更新廣告庫。本發(fā)明無需人工識(shí)別判斷誰是廣告用戶,便能夠自動(dòng)識(shí)別廣告從而能夠加以過濾,節(jié)省人力成本,提高廣告過濾的效率。