多模型訓(xùn)練方法、摘要分段方法、文本分段方法及裝置

基本信息

申請?zhí)?/td> CN202110762240.5 申請日 -
公開(公告)號 CN113204956A 公開(公告)日 2021-08-03
申請公布號 CN113204956A 申請公布日 2021-08-03
分類號 G06F40/205(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 蔣志燕;呂少領(lǐng);黃石磊;程剛 申請(專利權(quán))人 深圳市北科瑞聲科技股份有限公司
代理機(jī)構(gòu) 深圳智匯遠(yuǎn)見知識產(chǎn)權(quán)代理有限公司 代理人 劉潔;牛悅涵
地址 518036廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號深圳新一代產(chǎn)業(yè)園3棟1201-6
法律狀態(tài) -

摘要

摘要 本申請涉及人工智能技術(shù)領(lǐng)域,揭露了一種多模型訓(xùn)練方法,所述方法包括:將訓(xùn)練文本集中文本劃分為單句,得到訓(xùn)練單句集;對訓(xùn)練單句集進(jìn)行特征提取,得到訓(xùn)練單句向量集;提取訓(xùn)練單句向量集中訓(xùn)練單句的段落編碼特征以及摘要編碼特征;利用訓(xùn)練單句向量集和摘要編碼特征對預(yù)構(gòu)建的文本分段模型進(jìn)行第一訓(xùn)練,以及利用訓(xùn)練單句向量集和段落編碼特征對預(yù)構(gòu)建的文本摘要抽取模型進(jìn)行第二訓(xùn)練,得到標(biāo)準(zhǔn)文本分段模型和標(biāo)準(zhǔn)文本摘要抽取模型。此外,本申請還涉及一種摘要抽取方法、文本分段方法、裝置、設(shè)備及存儲介質(zhì)。本申請可以提高訓(xùn)練得到的文本分段模型和摘要抽取模型的模型準(zhǔn)確性,以及獲取訓(xùn)練得到的文本分段模型和摘要抽取模型的獲取效率。