一種用于數(shù)據(jù)集的數(shù)據(jù)使用質(zhì)量的評(píng)估方法

基本信息

申請(qǐng)?zhí)?/td> CN201610389829.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN105975631A 公開(kāi)(公告)日 2016-09-28
申請(qǐng)公布號(hào) CN105975631A 申請(qǐng)公布日 2016-09-28
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 阮彤;甘似禹;葉琪;李陽(yáng);趙亮 申請(qǐng)(專利權(quán))人 上海億通國(guó)際股份有限公司
代理機(jī)構(gòu) - 代理人 -
地址 200237 上海市徐匯區(qū)梅隴路130號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種用于數(shù)據(jù)集的數(shù)據(jù)使用質(zhì)量的評(píng)估方法,包括:獲取在數(shù)據(jù)集上回答自然語(yǔ)言問(wèn)題時(shí)的問(wèn)題評(píng)測(cè)集;根據(jù)所述問(wèn)題評(píng)測(cè)集的問(wèn)題進(jìn)行總結(jié)和歸納,形成多個(gè)問(wèn)題模板;以及根據(jù)所述問(wèn)題模板和使用質(zhì)量度量,將最終的查詢結(jié)果與正確答案進(jìn)行對(duì)比,計(jì)算出查詢結(jié)果的精度、召回率和綜合信息性以便用戶評(píng)估所述數(shù)據(jù)集的數(shù)據(jù)使用質(zhì)量。相比于現(xiàn)有技術(shù),本發(fā)明將數(shù)據(jù)集應(yīng)用于問(wèn)答系統(tǒng)時(shí)的問(wèn)題作為使用場(chǎng)景,每個(gè)查詢問(wèn)題對(duì)應(yīng)于一個(gè)使用場(chǎng)景,并通過(guò)可查詢性度量在數(shù)據(jù)集上構(gòu)建查詢的難以程度,以及通過(guò)信息性度量特定的使用場(chǎng)景中的查詢結(jié)果所包含的信息量,從而可操作地評(píng)估數(shù)據(jù)集的數(shù)據(jù)使用質(zhì)量。