文本標點預測方法、裝置、系統(tǒng)及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110555504.X | 申請日 | - |
公開(公告)號 | CN113378541A | 公開(公告)日 | 2021-09-10 |
申請公布號 | CN113378541A | 申請公布日 | 2021-09-10 |
分類號 | G06F40/20(2020.01)I;G06F40/289(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 何夢中;李秀林;吳本谷 | 申請(專利權(quán))人 | 標貝(北京)科技有限公司 |
代理機構(gòu) | 北京睿邦知識產(chǎn)權(quán)代理事務所(普通合伙) | 代理人 | 徐丁峰;戴亞南 |
地址 | 100192北京市海淀區(qū)西小口路66號中關(guān)村東升科技園·北領(lǐng)地B-2樓3層B303A | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種文本標點預測方法、裝置、系統(tǒng)及存儲介質(zhì)。方法包括:獲取待處理文本;按照文本段對待處理文本進行劃分,文本段是單個詞或單個字符;將文本劃分結(jié)果輸入標點預測模型,以獲得與待處理文本中的所有文本段一一對應的初始預測結(jié)果,初始預測結(jié)果包括與N個預設(shè)標點一一對應的N個預測概率,每個預測概率表示對應文本段后面的標點是對應預設(shè)標點的概率,N為大于1的正整數(shù);對待處理文本中的至少部分文本段所對應的初始預測結(jié)果進行平滑處理,以獲得與待處理文本中的所有文本段一一對應的最終預測結(jié)果;基于待處理文本中的所有文本段所對應的最終預測結(jié)果確定待處理文本包含的標點,以獲得標點預測結(jié)果。有助于提高標點預測的準確率。 |
