基于神經(jīng)網(wǎng)絡(luò)識(shí)別互聯(lián)網(wǎng)網(wǎng)站所屬業(yè)態(tài)的方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010932371.9 申請(qǐng)日 -
公開(公告)號(hào) CN112149413A 公開(公告)日 2020-12-29
申請(qǐng)公布號(hào) CN112149413A 申請(qǐng)公布日 2020-12-29
分類號(hào) G06F40/284(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊菁林;吳震;賀敏;唐積強(qiáng);張露晨;林紳文;董琳;馬秀娟;施力;張林波;陳梓瑄;潘曉;劉剛;胡曉光;周洋 申請(qǐng)(專利權(quán))人 深圳市任子行科技開發(fā)有限公司
代理機(jī)構(gòu) 深圳市順天達(dá)專利商標(biāo)代理有限公司 代理人 國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;深圳市任子行科技開發(fā)有限公司
地址 100029北京市朝陽區(qū)裕民路甲3號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于神經(jīng)網(wǎng)絡(luò)識(shí)別互聯(lián)網(wǎng)網(wǎng)站所屬業(yè)態(tài)的方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。該方法包括:獲取互聯(lián)網(wǎng)網(wǎng)站業(yè)態(tài)的文本數(shù)據(jù)集,從所述文本數(shù)據(jù)集中提取文本特征詞;基于所述文本特征詞對(duì)所述文本特征詞進(jìn)行詞向量化以獲取詞向量序列;將所述詞向量序列分別輸入遞歸神經(jīng)網(wǎng)絡(luò)及卷積神經(jīng)網(wǎng)絡(luò)模型,分別得到所述遞歸神經(jīng)網(wǎng)絡(luò)及卷積神經(jīng)網(wǎng)絡(luò)模型輸出的目標(biāo)特征向量,并將所述目標(biāo)特征向量進(jìn)行并聯(lián)拼接;將已拼接的所述目標(biāo)特征向量輸入全連接神經(jīng)網(wǎng)絡(luò),最后輸出概率預(yù)測(cè)向量;查找所述概率預(yù)測(cè)向量中的最大值,并以所述最大值對(duì)應(yīng)的業(yè)態(tài)作為所述互聯(lián)網(wǎng)網(wǎng)站的所屬業(yè)態(tài)。通過本發(fā)明,實(shí)現(xiàn)了高精度識(shí)別互聯(lián)網(wǎng)網(wǎng)站的所屬業(yè)態(tài)。??