一種基于意群劃分的文本處理技術(shù)方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201810380737.9 | 申請日 | - |
公開(公告)號 | CN110399603A | 公開(公告)日 | 2019-11-01 |
申請公布號 | CN110399603A | 申請公布日 | 2019-11-01 |
分類號 | G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 杜登斌; 丁雨 | 申請(專利權(quán))人 | 北京中潤普達信息技術(shù)有限公司 |
代理機構(gòu) | 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北京中潤普達信息技術(shù)有限公司 |
地址 | 100029 北京市西城區(qū)北三環(huán)中路甲29號院華尊大廈B座6層605 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于意群劃分的文本處理方法和系統(tǒng),包括:獲取待分析語義傾向性的文章,文章包括段落,段落包括句子,將句子劃分成表達單一語義的連續(xù)語言片段,作為語義意群,將語義意群進行分詞處理,得到候選詞;獲取由情感詞詞庫,為詞庫中每個情感詞分配傾向權(quán)重,構(gòu)建情感詞詞表,在情感詞詞表中檢索候選詞,提取與候選詞相對應(yīng)的情感詞作為句子的傾向詞;通過分別分析傾向詞前的程度副詞和否定詞,為傾向詞賦予程度權(quán)重和否定權(quán)重將否定權(quán)重、程度權(quán)重、傾向詞的傾向權(quán)重三者相乘得到語義意群的意群傾向分量,集合句子中每個意群的傾向分量,作為句子傾向分量,根據(jù)句子傾向分量,得到文章的語義傾向分量,作為文章的語義傾向性分析結(jié)果。 |
