字形碼相似度計算方法和關鍵字詞提取方法、系統(tǒng)及裝置

基本信息

申請?zhí)?/td> CN202110877695.1 申請日 -
公開(公告)號 CN113313100A 公開(公告)日 2021-08-27
申請公布號 CN113313100A 申請公布日 2021-08-27
分類號 G06K9/00;G06F40/109;G06F40/126 分類 計算;推算;計數(shù);
發(fā)明人 張潔;周揚;劉自成 申請(專利權)人 南京智盈人工智能研究院有限公司
代理機構 南京中擎科智知識產(chǎn)權代理事務所(普通合伙) 代理人 韓賽
地址 210012 江蘇省南京市雨花臺區(qū)寧雙路19號云密城2號樓13層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及字符智能識別領域,公開了字形碼相似度計算方法和關鍵字詞提取方法、系統(tǒng)及裝置,其技術方案要點是從待識別文字圖片中識別得到電子文本;在電子文本中設定要提取的關鍵字;根據(jù)關鍵字的字形碼,利用字形碼相似度計算方法計算關鍵字與字庫中所有字的字形碼相似度;在關鍵字與字庫中所有字的字形碼相似度得出后,找出所有與所述關鍵字的字形碼相似度達到設定閾值的字,即為關鍵字的相似字;從所述電子文本中提取所述關鍵字和所述相似字,在圖片文本識別的場景下,準確找到關鍵字的概率更高,更加有利于實際的使用。