一種基于內(nèi)容的計(jì)算移動(dòng)應(yīng)用相似性的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201510776878.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN105677695A | 公開(kāi)(公告)日 | 2016-06-15 |
申請(qǐng)公布號(hào) | CN105677695A | 申請(qǐng)公布日 | 2016-06-15 |
分類(lèi)號(hào) | G06F17/30(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 吳明暉;劉澤民;金蒼宏;應(yīng)晶 | 申請(qǐng)(專(zhuān)利權(quán))人 | 杭州圓橙科技有限公司 |
代理機(jī)構(gòu) | 杭州宇信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 杭州圓橙科技有限公司 |
地址 | 310016 浙江省杭州市上城區(qū)海潮路53號(hào)274室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于內(nèi)容的計(jì)算移動(dòng)應(yīng)用相似性的方法。包括如下步驟:在獲取大量移動(dòng)應(yīng)用信息后,進(jìn)行移動(dòng)應(yīng)用信息的提取,包括應(yīng)用名稱(chēng)、應(yīng)用類(lèi)型、應(yīng)用描述和應(yīng)用大小等;將應(yīng)用描述信息進(jìn)行分詞;將分詞完畢后的內(nèi)容分為兩份,一份整合后作為word2vec的模型的訓(xùn)練語(yǔ)料,另一份存成文檔集的形式并進(jìn)行TF-IDF的計(jì)算,然后將結(jié)果存入HBase數(shù)據(jù)倉(cāng)庫(kù);進(jìn)行app相似性查詢(xún)及計(jì)算。實(shí)施本發(fā)明的一種基于內(nèi)容的計(jì)算移動(dòng)應(yīng)用相似性的方法,具有以下有益效果:可以快速的響應(yīng)app的相似性查詢(xún),基于內(nèi)容的app特征及描述信息能夠很好地代指app,準(zhǔn)確率高,可提高app的搜索及推薦的準(zhǔn)確率。 |
