一種漢語兼語結(jié)構(gòu)獲取方法

基本信息

申請?zhí)?/td> CN201510846489.9 申請日 -
公開(公告)號 CN106815188B 公開(公告)日 2020-02-18
申請公布號 CN106815188B 申請公布日 2020-02-18
分類號 G06F40/284 分類 計算;推算;計數(shù);
發(fā)明人 符建輝;王衛(wèi)明;曹陽 申請(專利權(quán))人 中科國力(鎮(zhèn)江)智能技術(shù)有限公司
代理機(jī)構(gòu) 南京知識律師事務(wù)所 代理人 中科國力(鎮(zhèn)江)智能技術(shù)有限公司;鎮(zhèn)江諾尼基智能技術(shù)有限公司
地址 212009 江蘇省鎮(zhèn)江市高新技術(shù)產(chǎn)業(yè)開發(fā)園區(qū)經(jīng)十二路668號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種漢語兼語結(jié)構(gòu)獲取方法,包括對原始訓(xùn)練語料庫Corpus進(jìn)行分詞,形成分詞語料庫TCorpus;識別分詞語料庫TCorpus中的每條語句Si中動詞;應(yīng)用兼語模式對TCorpus中的語句進(jìn)行分析,對滿足兼語模式的語句形成候選兼語結(jié)構(gòu),并且置入待驗證的兼語結(jié)構(gòu)庫SOBase中;驗證候選兼語結(jié)構(gòu)庫SOBase,并輸出最終結(jié)果SOBaseResult;本發(fā)明引入了兼語模式,可在不降低獲取效果的前提下極大地控制兼語形式的復(fù)雜性。針對漢語構(gòu)詞和語句的復(fù)雜性,為確保兼語結(jié)構(gòu)的準(zhǔn)確性,本發(fā)明從“兼語結(jié)構(gòu)搭配多樣性”、“兼語結(jié)構(gòu)搭配常見性”雙重角度,對獲得的兼語結(jié)構(gòu)進(jìn)行嚴(yán)格的驗證。