一種用于數(shù)據集的數(shù)據使用質量的評估方法
基本信息
申請?zhí)?/td> | CN201610389829.4 | 申請日 | - |
公開(公告)號 | CN105975631A | 公開(公告)日 | 2016-09-28 |
申請公布號 | CN105975631A | 申請公布日 | 2016-09-28 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 阮彤;甘似禹;葉琪;李陽;趙亮 | 申請(專利權)人 | 上海億通國際股份有限公司 |
代理機構 | - | 代理人 | - |
地址 | 200237 上海市徐匯區(qū)梅隴路130號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種用于數(shù)據集的數(shù)據使用質量的評估方法,包括:獲取在數(shù)據集上回答自然語言問題時的問題評測集;根據所述問題評測集的問題進行總結和歸納,形成多個問題模板;以及根據所述問題模板和使用質量度量,將最終的查詢結果與正確答案進行對比,計算出查詢結果的精度、召回率和綜合信息性以便用戶評估所述數(shù)據集的數(shù)據使用質量。相比于現(xiàn)有技術,本發(fā)明將數(shù)據集應用于問答系統(tǒng)時的問題作為使用場景,每個查詢問題對應于一個使用場景,并通過可查詢性度量在數(shù)據集上構建查詢的難以程度,以及通過信息性度量特定的使用場景中的查詢結果所包含的信息量,從而可操作地評估數(shù)據集的數(shù)據使用質量。 |
