基于FM算法的CTR預(yù)估方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201810599540.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN108960293A 公開(kāi)(公告)日 2018-12-07
申請(qǐng)公布號(hào) CN108960293A 申請(qǐng)公布日 2018-12-07
分類(lèi)號(hào) G06K9/62;G06Q30/02 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張震;呂傳成 申請(qǐng)(專(zhuān)利權(quán))人 玩咖歡聚文化傳媒(北京)有限公司
代理機(jī)構(gòu) 北京酷愛(ài)智慧知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張紹磊
地址 100101 北京市朝陽(yáng)區(qū)安立路60號(hào)潤(rùn)楓德尚苑6號(hào)樓4層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供的基于FM算法的CTR預(yù)估方法及系統(tǒng),該方法在Spark集群對(duì)ml包實(shí)現(xiàn)FM模型擴(kuò)展,并對(duì)FM模型做降維優(yōu)化,得到準(zhǔn)線(xiàn)性模型;選取待測(cè)環(huán)境下不同的特征組合,對(duì)準(zhǔn)線(xiàn)性模型進(jìn)行模型訓(xùn)練;對(duì)不同特征組合的模型訓(xùn)練結(jié)果做A/B Test,選取效果最好的特征組合和訓(xùn)練后的準(zhǔn)線(xiàn)性模型作為最佳模型,并在HDFS中做持久化;調(diào)用最佳模型的準(zhǔn)線(xiàn)性模型,根據(jù)最佳模型的特征組合選取待測(cè)環(huán)境下的特征,將選取的特征傳入調(diào)用的準(zhǔn)線(xiàn)性模型中計(jì)算,得到CTR預(yù)估結(jié)果。通過(guò)FM模型能自動(dòng)學(xué)習(xí)高階屬性的權(quán)值,不用通過(guò)人工的方式選取特征來(lái)做交叉,考慮特征之間的關(guān)系,增強(qiáng)了模型的泛化能力,并且適合處理稀疏數(shù)據(jù),能夠用于對(duì)時(shí)間要求較高的計(jì)算廣告方向的CTR預(yù)估。