模型訓練方法、文本分段方法、摘要抽取方法及裝置

基本信息

申請?zhí)?/td> CN202110747227.2 申請日 -
公開(公告)號 CN113255319A 公開(公告)日 2021-08-13
申請公布號 CN113255319A 申請公布日 2021-08-13
分類號 G06F40/205(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳誠;黃石磊;程剛;呂少領 申請(專利權(quán))人 深圳市北科瑞聲科技股份有限公司
代理機構(gòu) 深圳智匯遠見知識產(chǎn)權(quán)代理有限公司 代理人 劉潔;牛悅涵
地址 518036廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號深圳新一代產(chǎn)業(yè)園3棟1201-6
法律狀態(tài) -

摘要

摘要 本申請涉及人工智能技術領域,揭露了一種模型訓練方法,所述方法包括:獲取訓練數(shù)據(jù)集,對訓練數(shù)據(jù)集進行預處理,得到訓練特征向量集;獲取預構(gòu)建的文本分段模型和文本摘要抽取模型;利用訓練特征向量集對文本分段模型和文本摘要抽取模型進行多輪交替訓練,在每輪交替訓練過程中利用文本分段模型的模型訓練結(jié)果對用于訓練文本摘要抽取模型的數(shù)據(jù)進行處理,以及利用文本摘要抽取模型的模型訓練結(jié)果對用于訓練文本分段模型的數(shù)據(jù)進行處理,得到標準文本分段模型和標準摘要抽取模型。此外,本申請還涉及一種文本分段方法、摘要抽取方法、裝置、設備及存儲介質(zhì)。本申請可以提高訓練得到的文本分段模型和摘要抽取模型的準確性。