一種語料生成方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110808793.X 申請(qǐng)日 -
公開(公告)號(hào) CN113486656A 公開(公告)日 2021-10-08
申請(qǐng)公布號(hào) CN113486656A 申請(qǐng)公布日 2021-10-08
分類號(hào) G06F40/284(2020.01)I;G06F16/36(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張江濱;施登亮;趙智源;?;奂?/td> 申請(qǐng)(專利權(quán))人 支付寶(杭州)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京億騰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 陳霽;周良玉
地址 310000浙江省杭州市西湖區(qū)西溪路556號(hào)8層B段801-11
法律狀態(tài) -

摘要

摘要 本說明書實(shí)施例提供了一種語料生成方法及裝置,該方法包括:獲取原始文本;對(duì)原始文本進(jìn)行關(guān)鍵詞匹配,從而確定出原始文本中的違規(guī)關(guān)鍵詞以及其對(duì)應(yīng)的基本關(guān)鍵詞,基本關(guān)鍵詞對(duì)應(yīng)于違規(guī)關(guān)鍵詞的正確形態(tài);確定基本關(guān)鍵詞的違規(guī)要素,并確定出與基本關(guān)鍵詞關(guān)于違規(guī)要素存在關(guān)聯(lián)的關(guān)聯(lián)關(guān)鍵詞;對(duì)關(guān)聯(lián)關(guān)鍵詞進(jìn)行文本變種,獲取變種文本;以變種文本,替換原始文本中的違規(guī)關(guān)鍵詞,生成語料文本。