一種三元組抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111494823.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114154489A | 公開(公告)日 | 2022-03-08 |
申請(qǐng)公布號(hào) | CN114154489A | 申請(qǐng)公布日 | 2022-03-08 |
分類號(hào) | G06F40/253(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王超;鄭力;楊聲春;游佳川;何諾;覃楊微;徐欣欣;王璇;劉馨楊;袁文憶 | 申請(qǐng)(專利權(quán))人 | 重慶農(nóng)村商業(yè)銀行股份有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 吳磊 |
地址 | 400000重慶市江北區(qū)金沙門路36號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種三元組抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),該方法包括:確定當(dāng)前需實(shí)現(xiàn)三元組抽取的任意文檔為待抽取文檔;將所述待抽取文檔輸入至分段模型中,得到所述分段模型輸出的分段結(jié)果,并基于該分段結(jié)果得到所述待抽取文檔包含的多個(gè)段落;將所述待抽取文檔包含的每個(gè)段落分別輸入至抽取模型中,得到所述抽取模型輸出的相應(yīng)段落中包含的三元組;其中,所述分段模型為預(yù)先利用多個(gè)文檔及相應(yīng)分段結(jié)果訓(xùn)練得到的,所述抽取模型為預(yù)先利用多個(gè)段落及該多個(gè)段落中各段落分別包含的三元組訓(xùn)練得到的??梢?,本申請(qǐng)能夠利用相應(yīng)模型自動(dòng)實(shí)現(xiàn)文檔中三元組的有效抽取,無需人工介入,從而能夠節(jié)省人力,縮短抽取時(shí)間,提高抽取效率。 |
