一種基于內(nèi)容的計算移動應(yīng)用相似性的方法
基本信息
申請?zhí)?/td> | CN201510776878.9 | 申請日 | - |
公開(公告)號 | CN105677695B | 公開(公告)日 | 2019-03-08 |
申請公布號 | CN105677695B | 申請公布日 | 2019-03-08 |
分類號 | G06F16/242(2019.01)I; G06F16/21(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 吳明暉; 劉澤民; 金蒼宏; 應(yīng)晶 | 申請(專利權(quán))人 | 杭州圓橙科技有限公司 |
代理機(jī)構(gòu) | 杭州宇信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 杭州圓橙科技有限公司 |
地址 | 310016 浙江省杭州市上城區(qū)海潮路53號274室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于內(nèi)容的計算移動應(yīng)用相似性的方法。包括如下步驟:在獲取大量移動應(yīng)用信息后,進(jìn)行移動應(yīng)用信息的提取,包括應(yīng)用名稱、應(yīng)用類型、應(yīng)用描述和應(yīng)用大小等;將應(yīng)用描述信息進(jìn)行分詞;將分詞完畢后的內(nèi)容分為兩份,一份整合后作為word2vec的模型的訓(xùn)練語料,另一份存成文檔集的形式并進(jìn)行TF?IDF的計算,然后將結(jié)果存入HBase數(shù)據(jù)倉庫;進(jìn)行app相似性查詢及計算。實施本發(fā)明的一種基于內(nèi)容的計算移動應(yīng)用相似性的方法,具有以下有益效果:可以快速的響應(yīng)app的相似性查詢,基于內(nèi)容的app特征及描述信息能夠很好地代指app,準(zhǔn)確率高,可提高app的搜索及推薦的準(zhǔn)確率。 |
