文本標點預測方法、裝置、系統(tǒng)及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110555504.X 申請日 -
公開(公告)號 CN113378541A 公開(公告)日 2021-09-10
申請公布號 CN113378541A 申請公布日 2021-09-10
分類號 G06F40/20(2020.01)I;G06F40/289(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 何夢中;李秀林;吳本谷 申請(專利權(quán))人 標貝(北京)科技有限公司
代理機構(gòu) 北京睿邦知識產(chǎn)權(quán)代理事務所(普通合伙) 代理人 徐丁峰;戴亞南
地址 100192北京市海淀區(qū)西小口路66號中關(guān)村東升科技園·北領(lǐng)地B-2樓3層B303A
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文本標點預測方法、裝置、系統(tǒng)及存儲介質(zhì)。方法包括:獲取待處理文本;按照文本段對待處理文本進行劃分,文本段是單個詞或單個字符;將文本劃分結(jié)果輸入標點預測模型,以獲得與待處理文本中的所有文本段一一對應的初始預測結(jié)果,初始預測結(jié)果包括與N個預設(shè)標點一一對應的N個預測概率,每個預測概率表示對應文本段后面的標點是對應預設(shè)標點的概率,N為大于1的正整數(shù);對待處理文本中的至少部分文本段所對應的初始預測結(jié)果進行平滑處理,以獲得與待處理文本中的所有文本段一一對應的最終預測結(jié)果;基于待處理文本中的所有文本段所對應的最終預測結(jié)果確定待處理文本包含的標點,以獲得標點預測結(jié)果。有助于提高標點預測的準確率。