一種用于數(shù)據集的數(shù)據使用質量的評估方法

基本信息

申請?zhí)?/td> CN201610389829.4 申請日 -
公開(公告)號 CN105975631A 公開(公告)日 2016-09-28
申請公布號 CN105975631A 申請公布日 2016-09-28
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 阮彤;甘似禹;葉琪;李陽;趙亮 申請(專利權)人 上海億通國際股份有限公司
代理機構 - 代理人 -
地址 200237 上海市徐匯區(qū)梅隴路130號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種用于數(shù)據集的數(shù)據使用質量的評估方法,包括:獲取在數(shù)據集上回答自然語言問題時的問題評測集;根據所述問題評測集的問題進行總結和歸納,形成多個問題模板;以及根據所述問題模板和使用質量度量,將最終的查詢結果與正確答案進行對比,計算出查詢結果的精度、召回率和綜合信息性以便用戶評估所述數(shù)據集的數(shù)據使用質量。相比于現(xiàn)有技術,本發(fā)明將數(shù)據集應用于問答系統(tǒng)時的問題作為使用場景,每個查詢問題對應于一個使用場景,并通過可查詢性度量在數(shù)據集上構建查詢的難以程度,以及通過信息性度量特定的使用場景中的查詢結果所包含的信息量,從而可操作地評估數(shù)據集的數(shù)據使用質量。