一種多標(biāo)簽復(fù)雜文本分類方法

基本信息

申請(qǐng)?zhí)?/td> CN202011328247.8 申請(qǐng)日 -
公開(公告)號(hào) CN113342970A 公開(公告)日 2021-09-03
申請(qǐng)公布號(hào) CN113342970A 申請(qǐng)公布日 2021-09-03
分類號(hào) G06F16/35(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王志鵬;孫力澤;朱西華;鄧強(qiáng) 申請(qǐng)(專利權(quán))人 中電萬維信息技術(shù)有限責(zé)任公司
代理機(jī)構(gòu) 蘭州嘉諾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 郭海
地址 730000甘肅省蘭州市城關(guān)區(qū)張?zhí)K灘553號(hào)(電信第二樞紐B區(qū)4-7層)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及的技術(shù)領(lǐng)域?yàn)槿斯ぶ悄茴I(lǐng)域,具體是一種基于Bert對(duì)多標(biāo)簽復(fù)雜文本分類方法。本發(fā)明旨在解決文本在數(shù)量多的情況下且類別復(fù)雜的文本分類問題。方法步驟包括:a)利用Bert提取文本信息;b)將Bert提取出來信息分別放入Attention和Cnn兩個(gè)層中繼續(xù)做特征提取;c)根據(jù)結(jié)果進(jìn)行迭代學(xué)習(xí)。在海量的信息中挑出有效的信息,利用模型提取出其中信息并進(jìn)行準(zhǔn)確分類。