語言形態(tài)分析器
基本信息
申請?zhí)?/td> | CN200510135590.X | 申請日 | - |
公開(公告)號 | CN1991819A | 公開(公告)日 | 2007-07-04 |
申請公布號 | CN1991819A | 申請公布日 | 2007-07-04 |
分類號 | G06F17/27(2006.01) | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 毛新年;李珩;董遠(yuǎn) | 申請(專利權(quán))人 | 北京法國電信研發(fā)中心有限公司 |
代理機(jī)構(gòu) | 北京市柳沈律師事務(wù)所 | 代理人 | 竇杰平 |
地址 | 100080北京市海淀區(qū)科學(xué)院南路2號融科資訊中心C座南樓10層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種自然語言形態(tài)分析器和一種通過計算機(jī)根據(jù)形態(tài)詞構(gòu)詞語法從文本中識別和提取所述語言的形態(tài)詞(MDW)的方法,所述方法包括以下步驟:加載形態(tài)詞構(gòu)詞語法的計算機(jī)可讀規(guī)則;輸入文本,并且按照該語言的標(biāo)點(diǎn)符號來從輸入文本獲得句子;形成每個句子的詞格,所述詞格包括至少一個元素,每個元素對應(yīng)于句子中一個字或一個可能的詞;通過使用與所加載的形態(tài)詞構(gòu)詞語法規(guī)則相結(jié)合的表解析算法來解析每個句子的詞格以從詞格的一個或多個元素中獲得MDW候選詞;以及輸出所獲得的MDW候選詞。本發(fā)明可以有效且高效地從文本識別和提取MDW,并且迅速獲得MDW的句法、語義和形態(tài)模式信息。 |
