一種術(shù)語(yǔ)抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111494808.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114154499A 公開(kāi)(公告)日 2022-03-08
申請(qǐng)公布號(hào) CN114154499A 申請(qǐng)公布日 2022-03-08
分類(lèi)號(hào) G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王超;鄭力;楊聲春;游佳川;何諾;覃楊微;徐欣欣;王璇;劉馨楊;袁文憶 申請(qǐng)(專(zhuān)利權(quán))人 重慶農(nóng)村商業(yè)銀行股份有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 吳磊
地址 400000重慶市江北區(qū)金沙門(mén)路36號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種術(shù)語(yǔ)抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),該方法包括:獲取訓(xùn)練數(shù)據(jù)集;利用所述訓(xùn)練數(shù)據(jù)集對(duì)預(yù)設(shè)模型進(jìn)行訓(xùn)練,得到術(shù)語(yǔ)抽取模型;確定當(dāng)前場(chǎng)景下需要進(jìn)行術(shù)語(yǔ)抽取的句子為待抽取句子,對(duì)所述待抽取句子進(jìn)行分詞處理,將當(dāng)前分詞處理所得的各詞語(yǔ)均輸入至所述術(shù)語(yǔ)抽取模型,并基于所述術(shù)語(yǔ)抽取模型輸出的信息確定相應(yīng)詞語(yǔ)為術(shù)語(yǔ);其中,所述訓(xùn)練數(shù)據(jù)集中包含當(dāng)前場(chǎng)景下指定領(lǐng)域的術(shù)語(yǔ)及對(duì)應(yīng)標(biāo)注,所述標(biāo)注包括對(duì)應(yīng)術(shù)語(yǔ)的詞性標(biāo)注及序列標(biāo)注。標(biāo)注的句子中的詞語(yǔ)輸入至術(shù)語(yǔ)抽取模型,即可得到該句子中包含的術(shù)語(yǔ),從而能夠快速高效的實(shí)現(xiàn)特定領(lǐng)域中的術(shù)語(yǔ)抽取。