一種研報(bào)文本實(shí)體名詞自動(dòng)識(shí)別方法
基本信息
申請(qǐng)?zhí)?/td> | CN201910280838.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN110188340A | 公開(kāi)(公告)日 | 2019-08-30 |
申請(qǐng)公布號(hào) | CN110188340A | 申請(qǐng)公布日 | 2019-08-30 |
分類號(hào) | G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 蔡青林 | 申請(qǐng)(專利權(quán))人 | 國(guó)金涌富資產(chǎn)管理有限公司 |
代理機(jī)構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 國(guó)金涌富資產(chǎn)管理有限公司 |
地址 | 201304 上海市浦東新區(qū)書(shū)院鎮(zhèn)船山街148號(hào)138室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種研報(bào)文本實(shí)體名詞自動(dòng)識(shí)別方法,首先根據(jù)金融專業(yè)詞典對(duì)研報(bào)進(jìn)行分詞,以歷史研報(bào)中出現(xiàn)的所有詞匯構(gòu)建詞庫(kù)。對(duì)于每個(gè)研報(bào)文本,計(jì)算其TF?IDF特征向量;基于決策樹(shù)方法將研報(bào)文本劃分至不同的實(shí)體名詞類別。本發(fā)明可自動(dòng)識(shí)別研報(bào)文本所包含的實(shí)體名詞,從文本數(shù)據(jù)挖掘的角度分析研報(bào)的主題類別;在智能投顧和智能投研等金融科技領(lǐng)域可發(fā)揮重要作用,如在大類資產(chǎn)配置中可自動(dòng)篩選宏觀指標(biāo)以提升系統(tǒng)決策效率等。 |
