一種研報文本實體名詞自動識別方法

基本信息

申請?zhí)?/td> CN201910280838.3 申請日 -
公開(公告)號 CN110188340A 公開(公告)日 2019-08-30
申請公布號 CN110188340A 申請公布日 2019-08-30
分類號 G06F17/27 分類 計算;推算;計數(shù);
發(fā)明人 蔡青林 申請(專利權(quán))人 國金涌富資產(chǎn)管理有限公司
代理機構(gòu) 杭州求是專利事務(wù)所有限公司 代理人 國金涌富資產(chǎn)管理有限公司
地址 201304 上海市浦東新區(qū)書院鎮(zhèn)船山街148號138室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種研報文本實體名詞自動識別方法,首先根據(jù)金融專業(yè)詞典對研報進行分詞,以歷史研報中出現(xiàn)的所有詞匯構(gòu)建詞庫。對于每個研報文本,計算其TF?IDF特征向量;基于決策樹方法將研報文本劃分至不同的實體名詞類別。本發(fā)明可自動識別研報文本所包含的實體名詞,從文本數(shù)據(jù)挖掘的角度分析研報的主題類別;在智能投顧和智能投研等金融科技領(lǐng)域可發(fā)揮重要作用,如在大類資產(chǎn)配置中可自動篩選宏觀指標(biāo)以提升系統(tǒng)決策效率等。