點擊誘餌標題語料識別模型訓練方法和裝置

基本信息

申請?zhí)?/td> CN201810246454.5 申請日 -
公開(公告)號 CN108491389B 公開(公告)日 2021-10-08
申請公布號 CN108491389B 申請公布日 2021-10-08
分類號 G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 祁斌川 申請(專利權)人 杭州朗和科技有限公司
代理機構 北京律智知識產權代理有限公司 代理人 闞梓瑄;王衛(wèi)忠
地址 310052浙江省杭州市濱江區(qū)長河街道網商路599號4幢301室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種點擊誘餌標題語料識別模型訓練方法和裝置。該方法包括:將語料樣本集合輸入機器學習模型,所述語料樣本集合包括已識別為點擊誘餌標題語料的語料樣本、以及隨機語料樣本,其中已識別為點擊誘餌標題語料的語料樣本占語料樣本集合中全部語料樣本的比例小于預定比例閾值;確定所述機器學習模型識別成點擊誘餌標題語料的語料樣本的數(shù)量占所述語料樣本集合中的語料樣本數(shù)量的占比是否滿足預定條件;如果確定的占比滿足預定條件,判斷停止訓練所述機器學習模型。本發(fā)明提高了建立點擊誘餌標題語料識別模型的效率。