基于句法分析和聚類的三元組生成方法、裝置及用戶終端

基本信息

申請?zhí)?/td> CN201711408501.3 申請日 -
公開(公告)號 CN108133014B 公開(公告)日 2022-03-22
申請公布號 CN108133014B 申請公布日 2022-03-22
分類號 G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06Q30/02(2012.01)I 分類 計算;推算;計數(shù);
發(fā)明人 牟昊;楊飛 申請(專利權(quán))人 廣州數(shù)說故事信息科技有限公司
代理機構(gòu) 廣州科捷知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 楊晶晶
地址 510623廣東省廣州市天河區(qū)黃埔大道西100號之一702房之五
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于句法分析和聚類的三元組生成方法、裝置及用戶終端,方法包括:獲取文本信息,清洗噪音并劃分為句子;將句子劃分為至少一個詞語;按句子順序?qū)⒃~語以及其對應(yīng)的詞性作為輸入,構(gòu)建句法依賴樹;將句法依賴樹轉(zhuǎn)換為無向圖,利用寬度搜索技術(shù)生成二元組,二元組表達為(特征詞,情感詞);獲取二元組中的特征詞,將特征詞轉(zhuǎn)換為特征向量;將特征向量作為輸入,通過K?Means算法進行聚類,使特征詞聚類為對應(yīng)的類別;獲取對應(yīng)的類別的ID,記為類別ID,輸出三元組,三元組表達為(類別ID,特征詞,情感詞)。本發(fā)明的優(yōu)點在于通過句法分析發(fā)現(xiàn)二元組,通過特征詞聚類,將類似的特征詞聚在一起,同時降低了人工成本。