模型訓(xùn)練方法、文本分段方法、摘要抽取方法及裝置
基本信息
申請?zhí)?/td> | CN202110747227.2 | 申請日 | - |
公開(公告)號(hào) | CN113255319A | 公開(公告)日 | 2021-08-13 |
申請公布號(hào) | CN113255319A | 申請公布日 | 2021-08-13 |
分類號(hào) | G06F40/205(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳誠;黃石磊;程剛;呂少領(lǐng) | 申請(專利權(quán))人 | 深圳市北科瑞聲科技股份有限公司 |
代理機(jī)構(gòu) | 深圳智匯遠(yuǎn)見知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉潔;牛悅涵 |
地址 | 518036廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號(hào)深圳新一代產(chǎn)業(yè)園3棟1201-6 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請涉及人工智能技術(shù)領(lǐng)域,揭露了一種模型訓(xùn)練方法,所述方法包括:獲取訓(xùn)練數(shù)據(jù)集,對訓(xùn)練數(shù)據(jù)集進(jìn)行預(yù)處理,得到訓(xùn)練特征向量集;獲取預(yù)構(gòu)建的文本分段模型和文本摘要抽取模型;利用訓(xùn)練特征向量集對文本分段模型和文本摘要抽取模型進(jìn)行多輪交替訓(xùn)練,在每輪交替訓(xùn)練過程中利用文本分段模型的模型訓(xùn)練結(jié)果對用于訓(xùn)練文本摘要抽取模型的數(shù)據(jù)進(jìn)行處理,以及利用文本摘要抽取模型的模型訓(xùn)練結(jié)果對用于訓(xùn)練文本分段模型的數(shù)據(jù)進(jìn)行處理,得到標(biāo)準(zhǔn)文本分段模型和標(biāo)準(zhǔn)摘要抽取模型。此外,本申請還涉及一種文本分段方法、摘要抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。本申請可以提高訓(xùn)練得到的文本分段模型和摘要抽取模型的準(zhǔn)確性。 |
