古籍專名識別方法以及裝置

基本信息

申請?zhí)?/td> CN201711012269.1 申請日 -
公開(公告)號 CN107704454A 公開(公告)日 2018-02-16
申請公布號 CN107704454A 申請公布日 2018-02-16
分類號 G06F17/27;G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 干生洪;洪濤 申請(專利權(quán))人 古聯(lián)(北京)數(shù)字傳媒科技有限公司
代理機(jī)構(gòu) 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 古聯(lián)(北京)數(shù)字傳媒科技有限公司
地址 100000 北京市豐臺區(qū)榆樹莊1號北京國家數(shù)字出版基地B008
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種古籍專名識別方法以及裝置,通過獲取古籍文本,基于古籍統(tǒng)計模型分詞算法對所述古籍文本進(jìn)行分詞處理,得到多個專名;基于預(yù)先保存的專名知識庫,對每個專名進(jìn)行分類;針對每個專名,判斷該專名是否是預(yù)先保存的專名知識庫中的書名;若不是,針對每個專名,在判斷該專名只屬于分類類別中的一個類別時,將該專名保存為所述古籍文本的目標(biāo)專名。該方法可以緩解傳統(tǒng)的手工專名標(biāo)注耗時耗力,傳統(tǒng)的機(jī)器標(biāo)注效果較差的問題。提高古籍專名識別的精度及質(zhì)量,從而滿足古籍整理出版工作中的實(shí)際應(yīng)用需求。