識(shí)別微信公眾號(hào)所屬業(yè)態(tài)的方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010097890.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111325021A 公開(kāi)(公告)日 2020-06-23
申請(qǐng)公布號(hào) CN111325021A 申請(qǐng)公布日 2020-06-23
分類號(hào) G06F40/284(2020.01)I 分類 -
發(fā)明人 唐積強(qiáng);吳震;馬秀娟;吳莉莉;王錕;李焱余;霍麗杰;胡曉光;劉剛;周洋 申請(qǐng)(專利權(quán))人 深圳市任子行科技開(kāi)發(fā)有限公司
代理機(jī)構(gòu) 深圳市順天達(dá)專利商標(biāo)代理有限公司 代理人 國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心;深圳市任子行科技開(kāi)發(fā)有限公司
地址 100029北京市朝陽(yáng)區(qū)裕民路甲3號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種識(shí)別微信公眾號(hào)所屬業(yè)態(tài)的方法及裝置,包括:獲取微信公眾號(hào)的文本數(shù)據(jù)集,基于所述文本數(shù)據(jù)集進(jìn)行BERT模型預(yù)訓(xùn)練,得到BERT中文詞向量;從所述文本數(shù)據(jù)集中提取文本特征詞,并基于所述BERT中文詞向量對(duì)所述文本特征詞進(jìn)行向量化,得到字向量序列;將所述字向量序列輸入LSTM?CNN模型,得到所述LSTM?CNN模型輸出的目標(biāo)特征向量;將所述目標(biāo)特征向量輸入softmax層,得到所述softmax層輸出的概率預(yù)測(cè)向量;查找所述概率預(yù)測(cè)向量中的最大值,并以所述最大值對(duì)應(yīng)的業(yè)態(tài)作為所述微信公眾號(hào)的所屬業(yè)態(tài)。通過(guò)本發(fā)明,實(shí)現(xiàn)了高精度識(shí)別微信公眾號(hào)的所屬業(yè)態(tài)。??