一種關(guān)鍵詞提取方法、裝置、計算機設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201910428670.6 申請日 -
公開(公告)號 CN110147425A 公開(公告)日 2019-08-20
申請公布號 CN110147425A 申請公布日 2019-08-20
分類號 G06F16/30 分類 計算;推算;計數(shù);
發(fā)明人 王志方;許鑒 申請(專利權(quán))人 華泰期貨有限公司
代理機構(gòu) 北京市萬慧達律師事務(wù)所 代理人 華泰期貨有限公司
地址 510030 廣東省廣州市越秀區(qū)東風東路761號麗豐大廈20層、29層04單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種關(guān)鍵詞提取方法、裝置、計算機設(shè)備及存儲介質(zhì),屬于自然語言處理領(lǐng)域。方法包括:對待提取文本進行處理,得到候選關(guān)鍵詞集合;分別計算候選關(guān)鍵詞集合中的各候選關(guān)鍵詞在待提取文本中的語序權(quán)重和語義權(quán)重;根據(jù)各候選關(guān)鍵詞在待提取文本中的語序權(quán)重和語義權(quán)重,確定各候選關(guān)鍵詞的最終權(quán)重;根據(jù)各候選關(guān)鍵詞的最終權(quán)重,在候選關(guān)鍵詞集合中選取關(guān)鍵詞。本發(fā)明實施例通過綜合考慮候選關(guān)鍵詞在待提取文本中的語序權(quán)重和語義權(quán)重進行關(guān)鍵詞篩選,使得候選關(guān)鍵詞對待提取文本的權(quán)重表示更為全面,由此能夠提高文本關(guān)鍵詞的準確度。