自然語言句法分析方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201610467343.8 申請日 -
公開(公告)號 CN107544955A 公開(公告)日 2018-01-05
申請公布號 CN107544955A 申請公布日 2018-01-05
分類號 G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳浩 申請(專利權)人 匯仕電子商務(上海)有限公司
代理機構 上海宏京知識產(chǎn)權代理事務所(普通合伙) 代理人 周高
地址 200333 上海市普陀區(qū)金通路799、899、999號16幢5-092室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種自然語言句法分析方法及系統(tǒng),該方法包括如下步驟:對輸入文本句進行分詞操作,提取各個單詞;對各個單詞進行詞性標注,獲取各個單詞的詞性;統(tǒng)計兩兩單詞之間構成依存關系的頻次,統(tǒng)計各單詞與另一單詞的詞性之間構成依存關系的頻次,統(tǒng)計兩兩單詞的詞性之間構成依存的頻次;在輸入文本句中的各單詞之間生成依存句法邊,以最大權值為唯一的邊生成有向樹圖;在有向樹圖中以Prim最小生成樹算法,計算出最小生成樹;對最小生成樹格式化輸出。本發(fā)明引入淺層分析的方式,獲取輸入文本的各個單詞和詞性。算法思路簡潔,數(shù)據(jù)處理速度快;可作為長句句法分析的關鍵技術深入研究。