一種廣告識(shí)別方法及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201710980185.0 申請(qǐng)日 -
公開(公告)號(hào) CN107657286B 公開(公告)日 2020-05-05
申請(qǐng)公布號(hào) CN107657286B 申請(qǐng)公布日 2020-05-05
分類號(hào) G06K9/62;G06F40/211;G06F16/36;G06Q30/02 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 郭祥昊 申請(qǐng)(專利權(quán))人 北京深極智能科技有限公司
代理機(jī)構(gòu) 泰和泰律師事務(wù)所 代理人 祝海燕
地址 100041 北京市石景山區(qū)實(shí)興大街30號(hào)院3號(hào)樓2層B-0035房間
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種廣告識(shí)別方法及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該方法包括以下步驟:廣告識(shí)別步驟以及廣告庫(kù)更新步驟,廣告識(shí)別步驟包括:讀取非系統(tǒng)消息語(yǔ)料,以至少讀取用戶ID和語(yǔ)料內(nèi)容;將讀取的語(yǔ)料和廣告庫(kù)中的語(yǔ)料進(jìn)行相似度匹配,基于相似度匹配結(jié)果確定所述語(yǔ)料是否為廣告;廣告庫(kù)更新步驟包括:將被確定為非廣告的非系統(tǒng)消息語(yǔ)料加入到在線語(yǔ)料庫(kù);獲取在線語(yǔ)料庫(kù)中存儲(chǔ)的多條語(yǔ)料的句子主干;基于獲取的句子主干出現(xiàn)的頻次以及用戶ID確定是否將句子主干放入廣告庫(kù)中,從而在確定放入廣告庫(kù)中的情況下更新廣告庫(kù)。本發(fā)明無(wú)需人工識(shí)別判斷誰(shuí)是廣告用戶,便能夠自動(dòng)識(shí)別廣告從而能夠加以過(guò)濾,節(jié)省人力成本,提高廣告過(guò)濾的效率。