基于知識圖譜對大量直播彈幕數(shù)據(jù)意圖標注方法

基本信息

申請?zhí)?/td> CN202110651380.5 申請日 -
公開(公告)號 CN113408252A 公開(公告)日 2021-09-17
申請公布號 CN113408252A 申請公布日 2021-09-17
分類號 G06F40/169(2020.01)I;G06F40/186(2020.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/215(2019.01)I;G06F16/74(2019.01)I;G06F16/75(2019.01)I;G06F16/78(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李抒雁;沙濤 申請(專利權)人 上海適享文化傳播有限公司
代理機構 南京鼎傲知識產權代理事務所(普通合伙) 代理人 劉藹民
地址 200120上海市浦東新區(qū)成山路800號A座1106室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于知識圖譜對大量直播彈幕數(shù)據(jù)意圖標注方法,包括如下步驟:S1、根據(jù)彈幕信息提取關鍵詞并對關鍵詞歸納維度;S2、擴建關鍵詞同音同義詞;S3、多個維度組合作為一個特定意圖的模板;S4、彈幕數(shù)據(jù)去重,無效數(shù)據(jù)去除;S5、彈幕數(shù)據(jù)過模板抽取觀點意圖;S6、人工校排查去除錯誤數(shù)據(jù),本發(fā)明結構科學合理,使用安全方便,本發(fā)明為快速標注直播彈幕數(shù)據(jù)意圖,高效率標注文本意圖,克服了數(shù)據(jù)量龐大人工效率低,傳統(tǒng)NLP在彈幕分析中效果差等缺點,對于數(shù)據(jù)中的語義進行定義,從而便于彈幕數(shù)據(jù)去重,降低了工作量,適合更好的推廣使用。