一種處理文本單元的方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110539425.X 申請日 -
公開(公告)號 CN113191157A 公開(公告)日 2021-07-30
申請公布號 CN113191157A 申請公布日 2021-07-30
分類號 G06F40/30(2020.01)I;G06F40/284(2020.01)I;G06F40/166(2020.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 史元春;喻純;楊歡 申請(專利權(quán))人 交互未來(北京)科技有限公司
代理機(jī)構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 周初冬
地址 100084北京市海淀區(qū)清華園
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種處理文本單元的方法及系統(tǒng),該方法為:利用預(yù)先訓(xùn)練得到的語義識別模型,對用戶用于編輯目標(biāo)文本的語音內(nèi)容進(jìn)行意圖分類,得到待分析文本和意圖分類結(jié)果;基于待分析文本中的內(nèi)容,確定待分析文本的格式是否為同音文本單元組詞的格式;若是,提取待分析文本中的最后一個(gè)文本單元并將其作為待處理文本單元,該待處理文本單元即為需要進(jìn)行處理的同音文本單元;根據(jù)意圖分類結(jié)果和待處理文本單元,對目標(biāo)文本進(jìn)行編輯,以實(shí)現(xiàn)輔助視障人群準(zhǔn)確的輸入同音文本單元,從而提高用戶體驗(yàn)。