基于海量數(shù)據(jù)的社會化人際關(guān)系網(wǎng)絡(luò)生成系統(tǒng)
基本信息
申請?zhí)?/td> | CN201210044484.0 | 申請日 | - |
公開(公告)號 | CN103294689A | 公開(公告)日 | 2013-09-11 |
申請公布號 | CN103294689A | 申請公布日 | 2013-09-11 |
分類號 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 楊俊拯;張旸;黃百寧;王世平;孟玲會 | 申請(專利權(quán))人 | 北京云泓道元信息技術(shù)有限公司 |
代理機構(gòu) | 上海專利商標事務(wù)所有限公司 | 代理人 | 施浩 |
地址 | 100025 北京市朝陽區(qū)遠洋天地61號遠洋商務(wù)2708室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于海量數(shù)據(jù)的社會化人際關(guān)系網(wǎng)絡(luò)生成系統(tǒng),能準確的生成社會化人際關(guān)系網(wǎng)絡(luò),無需語料庫的支持,且能提取出語義級別的關(guān)系。其技術(shù)方案為:系統(tǒng)包括文本預(yù)處理模塊、實體識別模塊、關(guān)系語義處理模塊以及基于海量數(shù)據(jù)的關(guān)系優(yōu)化模塊,其中:文本預(yù)處理模塊,對信息進行預(yù)處理,生成分割后的詞語的集合;實體識別模,將分割后的詞語識別為人際關(guān)系語言所定義的詞語,并按順序輸出詞語序列;關(guān)系語義處理模塊,通過人機關(guān)系語言所定義的語法對詞語序列進行語法處理,生成語法樹,從語法樹中提取人際關(guān)系數(shù)據(jù);基于海量數(shù)據(jù)的關(guān)系優(yōu)化模塊,從多個信息來源中提取人際關(guān)系數(shù)據(jù),通過海量數(shù)據(jù)對人際關(guān)系數(shù)據(jù)進行驗證、糾正和優(yōu)化。 |
