一種基于深度神經(jīng)網(wǎng)絡(luò)的公司網(wǎng)站關(guān)鍵詞提取方法

基本信息

申請(qǐng)?zhí)?/td> CN201811480597.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109710838B 公開(kāi)(公告)日 2021-02-26
申請(qǐng)公布號(hào) CN109710838B 申請(qǐng)公布日 2021-02-26
分類(lèi)號(hào) G06F40/284(2020.01)I;G06F16/9535(2019.01)I;G06N3/08(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王凱鋒;吳承霖;王海清 申請(qǐng)(專(zhuān)利權(quán))人 廈門(mén)笨鳥(niǎo)電子商務(wù)有限公司
代理機(jī)構(gòu) 廈門(mén)市新華專(zhuān)利商標(biāo)代理有限公司 代理人 羅恒蘭
地址 361000福建省廈門(mén)市思明區(qū)前埔路506、508號(hào)國(guó)金廣場(chǎng)B座6層01、02單元
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于深度神經(jīng)網(wǎng)絡(luò)的公司網(wǎng)站關(guān)鍵詞提取方法,其通過(guò)從公司的一級(jí)頁(yè)面和二級(jí)頁(yè)面中獲取基礎(chǔ)語(yǔ)料,然后從基礎(chǔ)語(yǔ)料中提取名詞短語(yǔ);利用循環(huán)神經(jīng)網(wǎng)絡(luò)模型對(duì)名詞短語(yǔ)進(jìn)行向量化,得到名詞短語(yǔ)向量;將公司的所有名詞短語(yǔ)向量進(jìn)行加權(quán)求和,得到代表一個(gè)公司整體的向量,即公司主向量;采用余弦相似度計(jì)算公司的各個(gè)名詞短語(yǔ)向量與該公司主向量之間的相似度,并按照相似程度由高至低對(duì)公司的名詞短語(yǔ)向量進(jìn)行排序,得到名詞短語(yǔ)排行榜;在名詞短語(yǔ)排行榜中選擇排名為前K名的名詞短語(yǔ)向量作為公司的主要關(guān)鍵詞。與現(xiàn)有技術(shù)相比,通過(guò)本發(fā)明方法獲取到的公司網(wǎng)站關(guān)鍵詞比較準(zhǔn)確,使用戶(hù)能準(zhǔn)確搜索或了解該公司的情況。??