一種影視劇本人物名稱的提取方法和裝置
基本信息
申請?zhí)?/td> | CN201711004919.8 | 申請日 | - |
公開(公告)號 | CN107844477B | 公開(公告)日 | 2021-03-19 |
申請公布號 | CN107844477B | 申請公布日 | 2021-03-19 |
分類號 | G06F40/284(2020.01)I;G06F40/242(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 柏昆 | 申請(專利權(quán))人 | 西安影視數(shù)據(jù)評估中心有限公司 |
代理機(jī)構(gòu) | 西安銘澤知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 李振瑞 |
地址 | 710071陜西省西安市曲江新區(qū)翠華南路0號佳和商務(wù)大廈01幢1單元4層10406號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種影視劇本人物名稱的提取方法和裝置,屬于文學(xué)領(lǐng)域。該方法包括S1,建立姓名詞典;S2,建立非姓名詞典;S3,將劇本文字的內(nèi)容中包含中英文冒號的文本行放到列表L1中,將不包含中英文冒號的文本行放到列表L2中;S4,逐行處理列表L1:S5,逐行處理列表L2;S6,逐行處理列表L3,從L3中移除S2中非姓名的詞匯,L3中剩下的詞即為從劇本中識別出的人物名稱;該裝置包括姓名字典模塊、非姓名字典模塊、分離模塊、第一存儲模塊、第二存儲模塊、處理模塊和提取模塊。?? |
