問句語義解析規(guī)則模板的生成方法、裝置、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010992511.1 申請日 -
公開(公告)號 CN111858900A 公開(公告)日 2020-10-30
申請公布號 CN111858900A 申請公布日 2020-10-30
分類號 G06F16/332(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 高鵬;康維鵬;周偉華;潘晶;袁蘭;高峰 申請(專利權(quán))人 杭州摸象大數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 杭州知學(xué)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 杭州摸象大數(shù)據(jù)科技有限公司
地址 311300浙江省杭州市余杭區(qū)余杭街道文一西路1818-2號中國人工智能小鎮(zhèn)6-6樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了問句語義解析規(guī)則模板的生成方法、裝置、設(shè)備及存儲介質(zhì),方法包括:采集線上問句,對每個(gè)所述問句進(jìn)行分詞、詞性及詞語拼音識別;統(tǒng)計(jì)各詞語的詞頻,基于所述詞頻及詞性,確定重要詞語列表,確定所述重要詞語列表中各詞語出當(dāng)前問句中的百分比位置信息及方差;遍歷每個(gè)線上問句,基于所述重要詞語列表生成泛化規(guī)則模版;基于泛化能力對所述泛化規(guī)則模版進(jìn)行篩選得到第一過濾規(guī)則模版;基于匹配準(zhǔn)確率對所述第一過濾規(guī)則模版進(jìn)行篩選得到問句語義解析規(guī)則模板。本發(fā)明從線上問句庫中,自動(dòng)挖掘產(chǎn)生高質(zhì)量規(guī)則匹配模板,并通過自動(dòng)策略產(chǎn)生一個(gè)泛化力、解析準(zhǔn)確率都較高的規(guī)則模板,從而從根源上解決了現(xiàn)有的線上問句解析問題。??