文本標(biāo)點(diǎn)預(yù)測(cè)方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110555504.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113378541A 公開(kāi)(公告)日 2021-09-10
申請(qǐng)公布號(hào) CN113378541A 申請(qǐng)公布日 2021-09-10
分類(lèi)號(hào) G06F40/20(2020.01)I;G06F40/289(2020.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 何夢(mèng)中;李秀林;吳本谷 申請(qǐng)(專(zhuān)利權(quán))人 標(biāo)貝(北京)科技有限公司
代理機(jī)構(gòu) 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 徐丁峰;戴亞南
地址 100192北京市海淀區(qū)西小口路66號(hào)中關(guān)村東升科技園·北領(lǐng)地B-2樓3層B303A
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文本標(biāo)點(diǎn)預(yù)測(cè)方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)。方法包括:獲取待處理文本;按照文本段對(duì)待處理文本進(jìn)行劃分,文本段是單個(gè)詞或單個(gè)字符;將文本劃分結(jié)果輸入標(biāo)點(diǎn)預(yù)測(cè)模型,以獲得與待處理文本中的所有文本段一一對(duì)應(yīng)的初始預(yù)測(cè)結(jié)果,初始預(yù)測(cè)結(jié)果包括與N個(gè)預(yù)設(shè)標(biāo)點(diǎn)一一對(duì)應(yīng)的N個(gè)預(yù)測(cè)概率,每個(gè)預(yù)測(cè)概率表示對(duì)應(yīng)文本段后面的標(biāo)點(diǎn)是對(duì)應(yīng)預(yù)設(shè)標(biāo)點(diǎn)的概率,N為大于1的正整數(shù);對(duì)待處理文本中的至少部分文本段所對(duì)應(yīng)的初始預(yù)測(cè)結(jié)果進(jìn)行平滑處理,以獲得與待處理文本中的所有文本段一一對(duì)應(yīng)的最終預(yù)測(cè)結(jié)果;基于待處理文本中的所有文本段所對(duì)應(yīng)的最終預(yù)測(cè)結(jié)果確定待處理文本包含的標(biāo)點(diǎn),以獲得標(biāo)點(diǎn)預(yù)測(cè)結(jié)果。有助于提高標(biāo)點(diǎn)預(yù)測(cè)的準(zhǔn)確率。