文本標(biāo)點(diǎn)預(yù)測(cè)方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110555504.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113378541A | 公開(kāi)(公告)日 | 2021-09-10 |
申請(qǐng)公布號(hào) | CN113378541A | 申請(qǐng)公布日 | 2021-09-10 |
分類(lèi)號(hào) | G06F40/20(2020.01)I;G06F40/289(2020.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 何夢(mèng)中;李秀林;吳本谷 | 申請(qǐng)(專(zhuān)利權(quán))人 | 標(biāo)貝(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 徐丁峰;戴亞南 |
地址 | 100192北京市海淀區(qū)西小口路66號(hào)中關(guān)村東升科技園·北領(lǐng)地B-2樓3層B303A | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種文本標(biāo)點(diǎn)預(yù)測(cè)方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)。方法包括:獲取待處理文本;按照文本段對(duì)待處理文本進(jìn)行劃分,文本段是單個(gè)詞或單個(gè)字符;將文本劃分結(jié)果輸入標(biāo)點(diǎn)預(yù)測(cè)模型,以獲得與待處理文本中的所有文本段一一對(duì)應(yīng)的初始預(yù)測(cè)結(jié)果,初始預(yù)測(cè)結(jié)果包括與N個(gè)預(yù)設(shè)標(biāo)點(diǎn)一一對(duì)應(yīng)的N個(gè)預(yù)測(cè)概率,每個(gè)預(yù)測(cè)概率表示對(duì)應(yīng)文本段后面的標(biāo)點(diǎn)是對(duì)應(yīng)預(yù)設(shè)標(biāo)點(diǎn)的概率,N為大于1的正整數(shù);對(duì)待處理文本中的至少部分文本段所對(duì)應(yīng)的初始預(yù)測(cè)結(jié)果進(jìn)行平滑處理,以獲得與待處理文本中的所有文本段一一對(duì)應(yīng)的最終預(yù)測(cè)結(jié)果;基于待處理文本中的所有文本段所對(duì)應(yīng)的最終預(yù)測(cè)結(jié)果確定待處理文本包含的標(biāo)點(diǎn),以獲得標(biāo)點(diǎn)預(yù)測(cè)結(jié)果。有助于提高標(biāo)點(diǎn)預(yù)測(cè)的準(zhǔn)確率。 |
