漢語句子混合模板的挖掘方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810201422.3 申請(qǐng)日 -
公開(公告)號(hào) CN108563617B 公開(公告)日 2021-09-21
申請(qǐng)公布號(hào) CN108563617B 申請(qǐng)公布日 2021-09-21
分類號(hào) G06F40/216;G06F40/211;G06F40/284;G06F40/295;G06F40/186 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 任禾 申請(qǐng)(專利權(quán))人 云知聲智能科技股份有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100096 北京市海淀區(qū)西三旗建材城內(nèi)1幢一層101號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種漢語句子混合模板的挖掘方法及裝置,其中,該方法包括:獲取預(yù)設(shè)文本,所述預(yù)設(shè)文本包括正例文本和負(fù)例文本;對(duì)預(yù)設(shè)文本中的每個(gè)句子分別進(jìn)行分析處理,確定句子的每個(gè)詞語的詞語參數(shù);根據(jù)所有詞語的詞語參數(shù)生成句子的候選模板;根據(jù)所有句子的所有候選模板合并生成不含有重復(fù)候選模板的模板列表,并生成正例模板集和負(fù)例模板集;從模板列表中選取目標(biāo)候選模板,根據(jù)目標(biāo)候選模板的正例次數(shù)和負(fù)例次數(shù)確定目標(biāo)候選模板的模板類型。該方法生成的句子模板是詞、詞性、命名實(shí)體和句法依賴關(guān)系的混合表達(dá),可以更加充分地刻畫一個(gè)句子中存在的語言規(guī)律,模板匹配能力強(qiáng)。