一種基于意群劃分的文本處理技術(shù)方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201810380737.9 申請(qǐng)日 -
公開(公告)號(hào) CN110399603A 公開(公告)日 2019-11-01
申請(qǐng)公布號(hào) CN110399603A 申請(qǐng)公布日 2019-11-01
分類號(hào) G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 杜登斌; 丁雨 申請(qǐng)(專利權(quán))人 北京中潤普達(dá)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京律誠同業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京中潤普達(dá)信息技術(shù)有限公司
地址 100029 北京市西城區(qū)北三環(huán)中路甲29號(hào)院華尊大廈B座6層605
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于意群劃分的文本處理方法和系統(tǒng),包括:獲取待分析語義傾向性的文章,文章包括段落,段落包括句子,將句子劃分成表達(dá)單一語義的連續(xù)語言片段,作為語義意群,將語義意群進(jìn)行分詞處理,得到候選詞;獲取由情感詞詞庫,為詞庫中每個(gè)情感詞分配傾向權(quán)重,構(gòu)建情感詞詞表,在情感詞詞表中檢索候選詞,提取與候選詞相對(duì)應(yīng)的情感詞作為句子的傾向詞;通過分別分析傾向詞前的程度副詞和否定詞,為傾向詞賦予程度權(quán)重和否定權(quán)重將否定權(quán)重、程度權(quán)重、傾向詞的傾向權(quán)重三者相乘得到語義意群的意群傾向分量,集合句子中每個(gè)意群的傾向分量,作為句子傾向分量,根據(jù)句子傾向分量,得到文章的語義傾向分量,作為文章的語義傾向性分析結(jié)果。