一種漢語兼語結(jié)構(gòu)獲取方法
基本信息
申請?zhí)?/td> | CN201510846489.9 | 申請日 | - |
公開(公告)號 | CN106815188B | 公開(公告)日 | 2020-02-18 |
申請公布號 | CN106815188B | 申請公布日 | 2020-02-18 |
分類號 | G06F40/284 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 符建輝;王衛(wèi)明;曹陽 | 申請(專利權(quán))人 | 中科國力(鎮(zhèn)江)智能技術(shù)有限公司 |
代理機(jī)構(gòu) | 南京知識律師事務(wù)所 | 代理人 | 中科國力(鎮(zhèn)江)智能技術(shù)有限公司;鎮(zhèn)江諾尼基智能技術(shù)有限公司 |
地址 | 212009 江蘇省鎮(zhèn)江市高新技術(shù)產(chǎn)業(yè)開發(fā)園區(qū)經(jīng)十二路668號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種漢語兼語結(jié)構(gòu)獲取方法,包括對原始訓(xùn)練語料庫Corpus進(jìn)行分詞,形成分詞語料庫TCorpus;識別分詞語料庫TCorpus中的每條語句Si中動詞;應(yīng)用兼語模式對TCorpus中的語句進(jìn)行分析,對滿足兼語模式的語句形成候選兼語結(jié)構(gòu),并且置入待驗證的兼語結(jié)構(gòu)庫SOBase中;驗證候選兼語結(jié)構(gòu)庫SOBase,并輸出最終結(jié)果SOBaseResult;本發(fā)明引入了兼語模式,可在不降低獲取效果的前提下極大地控制兼語形式的復(fù)雜性。針對漢語構(gòu)詞和語句的復(fù)雜性,為確保兼語結(jié)構(gòu)的準(zhǔn)確性,本發(fā)明從“兼語結(jié)構(gòu)搭配多樣性”、“兼語結(jié)構(gòu)搭配常見性”雙重角度,對獲得的兼語結(jié)構(gòu)進(jìn)行嚴(yán)格的驗證。 |
