一種基于意群劃分的文本處理技術(shù)方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201810380737.9 申請日 -
公開(公告)號 CN110399603A 公開(公告)日 2019-11-01
申請公布號 CN110399603A 申請公布日 2019-11-01
分類號 G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 杜登斌; 丁雨 申請(專利權(quán))人 北京中潤普達信息技術(shù)有限公司
代理機構(gòu) 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 代理人 北京中潤普達信息技術(shù)有限公司
地址 100029 北京市西城區(qū)北三環(huán)中路甲29號院華尊大廈B座6層605
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于意群劃分的文本處理方法和系統(tǒng),包括:獲取待分析語義傾向性的文章,文章包括段落,段落包括句子,將句子劃分成表達單一語義的連續(xù)語言片段,作為語義意群,將語義意群進行分詞處理,得到候選詞;獲取由情感詞詞庫,為詞庫中每個情感詞分配傾向權(quán)重,構(gòu)建情感詞詞表,在情感詞詞表中檢索候選詞,提取與候選詞相對應(yīng)的情感詞作為句子的傾向詞;通過分別分析傾向詞前的程度副詞和否定詞,為傾向詞賦予程度權(quán)重和否定權(quán)重將否定權(quán)重、程度權(quán)重、傾向詞的傾向權(quán)重三者相乘得到語義意群的意群傾向分量,集合句子中每個意群的傾向分量,作為句子傾向分量,根據(jù)句子傾向分量,得到文章的語義傾向分量,作為文章的語義傾向性分析結(jié)果。