一種影視劇本人物名稱的提取方法和裝置

基本信息

申請?zhí)?/td> CN201711004919.8 申請日 -
公開(公告)號 CN107844477B 公開(公告)日 2021-03-19
申請公布號 CN107844477B 申請公布日 2021-03-19
分類號 G06F40/284(2020.01)I;G06F40/242(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 柏昆 申請(專利權(quán))人 西安影視數(shù)據(jù)評估中心有限公司
代理機(jī)構(gòu) 西安銘澤知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李振瑞
地址 710071陜西省西安市曲江新區(qū)翠華南路0號佳和商務(wù)大廈01幢1單元4層10406號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種影視劇本人物名稱的提取方法和裝置,屬于文學(xué)領(lǐng)域。該方法包括S1,建立姓名詞典;S2,建立非姓名詞典;S3,將劇本文字的內(nèi)容中包含中英文冒號的文本行放到列表L1中,將不包含中英文冒號的文本行放到列表L2中;S4,逐行處理列表L1:S5,逐行處理列表L2;S6,逐行處理列表L3,從L3中移除S2中非姓名的詞匯,L3中剩下的詞即為從劇本中識別出的人物名稱;該裝置包括姓名字典模塊、非姓名字典模塊、分離模塊、第一存儲模塊、第二存儲模塊、處理模塊和提取模塊。??