多模型訓(xùn)練方法、摘要分段方法、文本分段方法及裝置
基本信息
申請?zhí)?/td> | CN202110762240.5 | 申請日 | - |
公開(公告)號 | CN113204956A | 公開(公告)日 | 2021-08-03 |
申請公布號 | CN113204956A | 申請公布日 | 2021-08-03 |
分類號 | G06F40/205(2020.01)I;G06F40/126(2020.01)I;G06F40/216(2020.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 蔣志燕;呂少領(lǐng);黃石磊;程剛 | 申請(專利權(quán))人 | 深圳市北科瑞聲科技股份有限公司 |
代理機(jī)構(gòu) | 深圳智匯遠(yuǎn)見知識產(chǎn)權(quán)代理有限公司 | 代理人 | 劉潔;牛悅涵 |
地址 | 518036廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號深圳新一代產(chǎn)業(yè)園3棟1201-6 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請涉及人工智能技術(shù)領(lǐng)域,揭露了一種多模型訓(xùn)練方法,所述方法包括:將訓(xùn)練文本集中文本劃分為單句,得到訓(xùn)練單句集;對訓(xùn)練單句集進(jìn)行特征提取,得到訓(xùn)練單句向量集;提取訓(xùn)練單句向量集中訓(xùn)練單句的段落編碼特征以及摘要編碼特征;利用訓(xùn)練單句向量集和摘要編碼特征對預(yù)構(gòu)建的文本分段模型進(jìn)行第一訓(xùn)練,以及利用訓(xùn)練單句向量集和段落編碼特征對預(yù)構(gòu)建的文本摘要抽取模型進(jìn)行第二訓(xùn)練,得到標(biāo)準(zhǔn)文本分段模型和標(biāo)準(zhǔn)文本摘要抽取模型。此外,本申請還涉及一種摘要抽取方法、文本分段方法、裝置、設(shè)備及存儲介質(zhì)。本申請可以提高訓(xùn)練得到的文本分段模型和摘要抽取模型的模型準(zhǔn)確性,以及獲取訓(xùn)練得到的文本分段模型和摘要抽取模型的獲取效率。 |
