古籍書名識(shí)別方法以及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201711177794.9 申請(qǐng)日 -
公開(公告)號(hào) CN107832303A 公開(公告)日 2018-03-23
申請(qǐng)公布號(hào) CN107832303A 申請(qǐng)公布日 2018-03-23
分類號(hào) G06F17/27;G06F17/30 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 洪濤;干生洪 申請(qǐng)(專利權(quán))人 古聯(lián)(北京)數(shù)字傳媒科技有限公司
代理機(jī)構(gòu) 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 古聯(lián)(北京)數(shù)字傳媒科技有限公司
地址 100000 北京市豐臺(tái)區(qū)榆樹莊1號(hào)北京國(guó)家數(shù)字出版基地B008
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種古籍書名識(shí)別方法以及裝置,通過(guò)獲取古籍文本,基于古籍統(tǒng)計(jì)模型分詞算法對(duì)所述古籍文本進(jìn)行分詞處理,得到多個(gè)分詞;基于預(yù)先保存的書名知識(shí)庫(kù),對(duì)每個(gè)分詞進(jìn)行分類,其中,分類類別包括:書名、篇名、樂舞名、書名簡(jiǎn)稱、篇名簡(jiǎn)稱以及含人名書名;針對(duì)每個(gè)分詞,在判斷該分詞只屬于分類類別中的一個(gè)類別時(shí),將該分詞保存為所述古籍文本的目標(biāo)書名。該方法可以緩解傳統(tǒng)的手工書名標(biāo)注耗時(shí)耗力,傳統(tǒng)的機(jī)器標(biāo)注效果較差的問(wèn)題。提高古籍書名識(shí)別的精度及質(zhì)量,從而滿足古籍整理出版工作中的實(shí)際應(yīng)用需求。