標(biāo)點(diǎn)符號(hào)標(biāo)注方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110828958.X 申請(qǐng)日 -
公開(公告)號(hào) CN113449489A 公開(公告)日 2021-09-28
申請(qǐng)公布號(hào) CN113449489A 申請(qǐng)公布日 2021-09-28
分類號(hào) G06F40/117(2020.01)I;G06F40/211(2020.01)I;G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 耿思晴;潘晟鋒;文博;劉云峰 申請(qǐng)(專利權(quán))人 深圳追一科技有限公司
代理機(jī)構(gòu) 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 代理人 黃晶晶
地址 518057廣東省深圳市南山區(qū)粵海街道科技園社區(qū)科苑路8號(hào)訊美科技廣場(chǎng)3號(hào)樓23A、23B
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種標(biāo)點(diǎn)符號(hào)標(biāo)注方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。該方法包括:獲取包括多組樣本數(shù)據(jù)的訓(xùn)練數(shù)據(jù)集,每組樣本數(shù)據(jù)中包括無標(biāo)點(diǎn)的樣本文本和對(duì)應(yīng)的標(biāo)點(diǎn)符號(hào)樣本標(biāo)簽序列;根據(jù)各樣本文本的文本長(zhǎng)度,確定待訓(xùn)練的標(biāo)點(diǎn)預(yù)測(cè)模型的卷積核數(shù)量和各卷積核的長(zhǎng)度,對(duì)待訓(xùn)練的標(biāo)點(diǎn)預(yù)測(cè)模型進(jìn)行迭代訓(xùn)練,得到標(biāo)點(diǎn)預(yù)測(cè)模型;標(biāo)點(diǎn)預(yù)測(cè)模型中包括用于獲取長(zhǎng)距離的上下文信息的第一卷積核和用于獲取短距離的上下文信息的第二卷積核;將無標(biāo)點(diǎn)符號(hào)的待標(biāo)注文本輸入至標(biāo)點(diǎn)預(yù)測(cè)模型中,輸出對(duì)應(yīng)于待標(biāo)注文本的標(biāo)點(diǎn)符號(hào)標(biāo)簽序列,并將待標(biāo)注文本和標(biāo)點(diǎn)符號(hào)標(biāo)簽序列整合,生成標(biāo)注有標(biāo)號(hào)符號(hào)的文本。采用本方法能為文本進(jìn)行更為準(zhǔn)確地預(yù)測(cè)標(biāo)點(diǎn)符號(hào)。