組織機(jī)構(gòu)信息的抽取方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202110485512.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113239144A 公開(kāi)(公告)日 2021-08-10
申請(qǐng)公布號(hào) CN113239144A 申請(qǐng)公布日 2021-08-10
分類號(hào) G06F16/33(2019.01)I;G06F40/295(2020.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 喻銀根 申請(qǐng)(專利權(quán))人 天九共享網(wǎng)絡(luò)科技集團(tuán)有限公司
代理機(jī)構(gòu) 北京英創(chuàng)嘉友知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 曾堯
地址 100012北京市朝陽(yáng)區(qū)安立路30號(hào)仰山公園8號(hào)樓
法律狀態(tài) -

摘要

摘要 本公開(kāi)涉及一種組織機(jī)構(gòu)信息的抽取方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備,以解決樣本不足導(dǎo)致模型抽取的準(zhǔn)確率和召回率低的問(wèn)題,該方法包括:將文本數(shù)據(jù)輸入到深度學(xué)習(xí)模型,得到所述深度學(xué)習(xí)模型輸出的第一抽取結(jié)果,并判斷所述第一抽取結(jié)果是否屬于所述組織機(jī)構(gòu)信息;將所述文本數(shù)據(jù)輸入到遠(yuǎn)程監(jiān)督知識(shí)庫(kù),得到所述遠(yuǎn)程監(jiān)督知識(shí)庫(kù)輸出的第二抽取結(jié)果,并判斷所述第二抽取結(jié)果是否屬于所述組織機(jī)構(gòu)信息;在所述第一抽取結(jié)果屬于所述組織機(jī)構(gòu)信息的情況下,將所述第一抽取結(jié)果添加進(jìn)所述遠(yuǎn)程監(jiān)督知識(shí)庫(kù);在所述第二抽取結(jié)果屬于所述組織機(jī)構(gòu)信息的情況下,將所述文本數(shù)據(jù)和所述第二抽取結(jié)果作為所述深度學(xué)習(xí)模型的標(biāo)注樣本。