一種多段落文本的特征抽取系統(tǒng)的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201710287337.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107122350B | 公開(kāi)(公告)日 | 2017-09-01 |
申請(qǐng)公布號(hào) | CN107122350B | 申請(qǐng)公布日 | 2017-09-01 |
分類(lèi)號(hào) | G06F40/216(2020.01)I; | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 許延祥;王飛劍;劉宗福;周東紅;黃世祥 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京和利時(shí)數(shù)字技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京細(xì)軟智谷知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 付登云 |
地址 | 100089北京市海淀區(qū)西三環(huán)北路27號(hào)1區(qū)15號(hào)樓第11層西區(qū)1101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種多段落文本的特征抽取系統(tǒng)及方法,包括第一計(jì)算模塊、主控模塊、權(quán)重設(shè)置模塊、文本處理模塊、分詞器和第二計(jì)算模塊;所述第一計(jì)算模塊、權(quán)重設(shè)置模塊、文本處理模塊、分詞器和第二計(jì)算模塊均與主控模塊進(jìn)行數(shù)據(jù)交互。本發(fā)明提供的技術(shù)方案通用、可行的來(lái)實(shí)現(xiàn)文本特征提取,并在文本特征提取過(guò)程中,能夠體現(xiàn)文本中不同段落的權(quán)重差異。?? |
