模型訓(xùn)練方法、文本分段方法、摘要抽取方法及裝置

基本信息

申請?zhí)?/td> CN202110747227.2 申請日 -
公開(公告)號(hào) CN113255319A 公開(公告)日 2021-08-13
申請公布號(hào) CN113255319A 申請公布日 2021-08-13
分類號(hào) G06F40/205(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳誠;黃石磊;程剛;呂少領(lǐng) 申請(專利權(quán))人 深圳市北科瑞聲科技股份有限公司
代理機(jī)構(gòu) 深圳智匯遠(yuǎn)見知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉潔;牛悅涵
地址 518036廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號(hào)深圳新一代產(chǎn)業(yè)園3棟1201-6
法律狀態(tài) -

摘要

摘要 本申請涉及人工智能技術(shù)領(lǐng)域,揭露了一種模型訓(xùn)練方法,所述方法包括:獲取訓(xùn)練數(shù)據(jù)集,對訓(xùn)練數(shù)據(jù)集進(jìn)行預(yù)處理,得到訓(xùn)練特征向量集;獲取預(yù)構(gòu)建的文本分段模型和文本摘要抽取模型;利用訓(xùn)練特征向量集對文本分段模型和文本摘要抽取模型進(jìn)行多輪交替訓(xùn)練,在每輪交替訓(xùn)練過程中利用文本分段模型的模型訓(xùn)練結(jié)果對用于訓(xùn)練文本摘要抽取模型的數(shù)據(jù)進(jìn)行處理,以及利用文本摘要抽取模型的模型訓(xùn)練結(jié)果對用于訓(xùn)練文本分段模型的數(shù)據(jù)進(jìn)行處理,得到標(biāo)準(zhǔn)文本分段模型和標(biāo)準(zhǔn)摘要抽取模型。此外,本申請還涉及一種文本分段方法、摘要抽取方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。本申請可以提高訓(xùn)練得到的文本分段模型和摘要抽取模型的準(zhǔn)確性。