一種行業(yè)代碼標(biāo)準(zhǔn)化方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110938055.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113392939A | 公開(公告)日 | 2021-09-14 |
申請(qǐng)公布號(hào) | CN113392939A | 申請(qǐng)公布日 | 2021-09-14 |
分類號(hào) | G06K9/62(2006.01)I;G06Q40/02(2012.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 蔣晟;施志暉 | 申請(qǐng)(專利權(quán))人 | 江蘇蘇寧銀行股份有限公司 |
代理機(jī)構(gòu) | 南京瑞華騰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 邱歡歡 |
地址 | 210000江蘇省南京市建鄴區(qū)河西金融城4號(hào)樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種行業(yè)代碼標(biāo)準(zhǔn)化方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),該方法包括如下步驟:獲取行業(yè)數(shù)據(jù);通過正則表達(dá)式對(duì)行業(yè)數(shù)據(jù)進(jìn)行數(shù)據(jù)格式分類,針對(duì)不同分類結(jié)果進(jìn)行預(yù)處理,獲得數(shù)字代碼和中文描述A;判斷數(shù)字代碼是否在標(biāo)準(zhǔn)版本中,如果在,則補(bǔ)齊行業(yè)門類字母,生成行業(yè)代碼;判斷數(shù)字代碼是否在歷史版本中,如果在,則取出歷史版本中對(duì)應(yīng)的中文描述B;將中文描述A或中文描述B與一標(biāo)準(zhǔn)版本中文描述進(jìn)行相似度計(jì)算,重復(fù)操作,獲得標(biāo)準(zhǔn)版本中最相似的中文描述C;根據(jù)中文描述C,查找出對(duì)應(yīng)的標(biāo)準(zhǔn)版本行業(yè)代碼并輸出。本發(fā)明通過中文描述相似度特征,自動(dòng)進(jìn)行碼值轉(zhuǎn)換,相對(duì)于人工進(jìn)行碼值映射大大提高了工作效率。 |
