基于句法分析和聚類的三元組生成方法、裝置及用戶終端
基本信息
申請?zhí)?/td> | CN201711408501.3 | 申請日 | - |
公開(公告)號 | CN108133014B | 公開(公告)日 | 2022-03-22 |
申請公布號 | CN108133014B | 申請公布日 | 2022-03-22 |
分類號 | G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06Q30/02(2012.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 牟昊;楊飛 | 申請(專利權(quán))人 | 廣州數(shù)說故事信息科技有限公司 |
代理機構(gòu) | 廣州科捷知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 楊晶晶 |
地址 | 510623廣東省廣州市天河區(qū)黃埔大道西100號之一702房之五 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了基于句法分析和聚類的三元組生成方法、裝置及用戶終端,方法包括:獲取文本信息,清洗噪音并劃分為句子;將句子劃分為至少一個詞語;按句子順序?qū)⒃~語以及其對應(yīng)的詞性作為輸入,構(gòu)建句法依賴樹;將句法依賴樹轉(zhuǎn)換為無向圖,利用寬度搜索技術(shù)生成二元組,二元組表達為(特征詞,情感詞);獲取二元組中的特征詞,將特征詞轉(zhuǎn)換為特征向量;將特征向量作為輸入,通過K?Means算法進行聚類,使特征詞聚類為對應(yīng)的類別;獲取對應(yīng)的類別的ID,記為類別ID,輸出三元組,三元組表達為(類別ID,特征詞,情感詞)。本發(fā)明的優(yōu)點在于通過句法分析發(fā)現(xiàn)二元組,通過特征詞聚類,將類似的特征詞聚在一起,同時降低了人工成本。 |
