一種基于無監(jiān)督的長短影評細粒度觀點挖掘方法

基本信息

申請?zhí)?/td> CN202110904457.5 申請日 -
公開(公告)號 CN113641788A 公開(公告)日 2021-11-12
申請公布號 CN113641788A 申請公布日 2021-11-12
分類號 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F16/951(2019.01)I;G06F40/194(2020.01)I;G06F40/242(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 秦濤;劉爐林;劉博豪;李悅;史鎮(zhèn)光;靳國慶 申請(專利權)人 人民網(wǎng)股份有限公司
代理機構 西安智大知識產(chǎn)權代理事務所 代理人 段俊濤
地址 100035北京市西城區(qū)新街口外大街28號B座234號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于無監(jiān)督的長短影評細粒度觀點挖掘方法,其特征在于:1)從社交平臺和電影平臺進行多維度的影評文本信息獲??;2)基于開源中文情感詞典,采用SO?PMI詞典擴展方法構建影評情感詞典;3)采用基于關聯(lián)規(guī)則方法和word2vec挖掘全局評價對象和個性化評價對象,再通過K?means形成完整短影評評價對象;4)采用MG?LDA結合word2vec發(fā)現(xiàn)長影評的主題分布以及詞分布,構建長影評評價對象;5)對評價對象進行情感分析并形成影評觀點摘要。本發(fā)明所公開無監(jiān)督長短影評細粒度觀點挖掘方法,較現(xiàn)有的影評挖掘方法相比,可以獲取更豐富的影評文本數(shù)據(jù),充分挖掘影評文本信息,針對影評長短采用不同的模型獲取評價對象,使得本發(fā)明的觀點挖掘和情感分析效果更佳。