一種基于內(nèi)容的計(jì)算移動(dòng)應(yīng)用相似性的方法

基本信息

申請(qǐng)?zhí)?/td> CN201510776878.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN105677695A 公開(kāi)(公告)日 2016-06-15
申請(qǐng)公布號(hào) CN105677695A 申請(qǐng)公布日 2016-06-15
分類(lèi)號(hào) G06F17/30(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳明暉;劉澤民;金蒼宏;應(yīng)晶 申請(qǐng)(專(zhuān)利權(quán))人 杭州圓橙科技有限公司
代理機(jī)構(gòu) 杭州宇信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 杭州圓橙科技有限公司
地址 310016 浙江省杭州市上城區(qū)海潮路53號(hào)274室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于內(nèi)容的計(jì)算移動(dòng)應(yīng)用相似性的方法。包括如下步驟:在獲取大量移動(dòng)應(yīng)用信息后,進(jìn)行移動(dòng)應(yīng)用信息的提取,包括應(yīng)用名稱(chēng)、應(yīng)用類(lèi)型、應(yīng)用描述和應(yīng)用大小等;將應(yīng)用描述信息進(jìn)行分詞;將分詞完畢后的內(nèi)容分為兩份,一份整合后作為word2vec的模型的訓(xùn)練語(yǔ)料,另一份存成文檔集的形式并進(jìn)行TF-IDF的計(jì)算,然后將結(jié)果存入HBase數(shù)據(jù)倉(cāng)庫(kù);進(jìn)行app相似性查詢(xún)及計(jì)算。實(shí)施本發(fā)明的一種基于內(nèi)容的計(jì)算移動(dòng)應(yīng)用相似性的方法,具有以下有益效果:可以快速的響應(yīng)app的相似性查詢(xún),基于內(nèi)容的app特征及描述信息能夠很好地代指app,準(zhǔn)確率高,可提高app的搜索及推薦的準(zhǔn)確率。