一種基于卷積神經(jīng)網(wǎng)絡(luò)和BM25的外賣(mài)評(píng)論情感極性分析方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011244556.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112307211A | 公開(kāi)(公告)日 | 2021-02-02 |
申請(qǐng)公布號(hào) | CN112307211A | 申請(qǐng)公布日 | 2021-02-02 |
分類(lèi)號(hào) | G06F16/35(2019.01)I; | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 廖杰;鄧方華;張衍彬 | 申請(qǐng)(專(zhuān)利權(quán))人 | 深圳市洪堡智慧餐飲科技有限公司 |
代理機(jī)構(gòu) | 深圳市深聯(lián)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 張琪 |
地址 | 518000廣東省深圳市福田區(qū)梅林街道孖嶺社區(qū)凱豐路10號(hào)翠林大廈8層808A | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,具體為一種基于卷積神經(jīng)網(wǎng)絡(luò)和BM25的外賣(mài)評(píng)論情感極性分析方法,該方法的步驟如下:步驟一、爬取門(mén)店的評(píng)論數(shù)據(jù),人工標(biāo)注導(dǎo)入數(shù)據(jù)庫(kù);步驟二、對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗;步驟三、數(shù)據(jù)分詞處理并計(jì)算詞向量;步驟四、采用卷積神經(jīng)網(wǎng)絡(luò)CNN訓(xùn)練模型;步驟五、利用模型預(yù)測(cè)結(jié)果,本發(fā)明使用了BM25的改進(jìn)算法,和基準(zhǔn)TFIDF比較,BM25算法在TF計(jì)算方法中增加了一個(gè)常量k,用來(lái)限制TF值的增長(zhǎng)極限,BM25的TF Score會(huì)被限制在0—k+1之間,TF Score不可能無(wú)限的增加,從而更加符合文本相關(guān)性的邏輯,本發(fā)明利用卷積神經(jīng)網(wǎng)絡(luò)CNN不需要依賴(lài)前面的結(jié)果,因此訓(xùn)練速度會(huì)更快。?? |
