基于線上大數(shù)據(jù)智能聚合模式下的數(shù)據(jù)可靠性評(píng)價(jià)算法

基本信息

申請(qǐng)?zhí)?/td> CN202110287067.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113032561A 公開(kāi)(公告)日 2021-06-25
申請(qǐng)公布號(hào) CN113032561A 申請(qǐng)公布日 2021-06-25
分類(lèi)號(hào) G06F16/35;G06Q40/02 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 譚繼軍;李陽(yáng);蔣華東 申請(qǐng)(專(zhuān)利權(quán))人 上海數(shù)喆數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 成都嘉企源知識(shí)產(chǎn)權(quán)代理有限公司 代理人 何朝友
地址 200000 上海市楊浦區(qū)國(guó)和路60號(hào)(集中登記地)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于線上大數(shù)據(jù)智能聚合模式下的數(shù)據(jù)可靠性評(píng)價(jià)算法,包括如下步驟:步驟1,數(shù)據(jù)源采信的權(quán)重賦值:對(duì)數(shù)據(jù)源進(jìn)行信用評(píng)級(jí),決定數(shù)據(jù)源采信的權(quán)重zi;步驟2,數(shù)據(jù)源可靠性賦值:對(duì)同一類(lèi)型數(shù)據(jù)基于關(guān)鍵詞聚類(lèi)出現(xiàn)次數(shù)進(jìn)行賦值決定數(shù)據(jù)采信分值,基于聚類(lèi)出現(xiàn)次數(shù)進(jìn)行可靠性賦值Si;步驟3,可靠性評(píng)價(jià)分值計(jì)算:取不同結(jié)果的基于聚類(lèi)結(jié)果獲得可靠性分Si,取這個(gè)結(jié)果所有數(shù)據(jù)源中數(shù)據(jù)源信用評(píng)價(jià)最高對(duì)應(yīng)的權(quán)重系數(shù)zi,即可計(jì)算該結(jié)果可靠性性評(píng)價(jià)分值Yi=zi*Si。本發(fā)明能夠自動(dòng)判斷不同數(shù)據(jù)結(jié)果的可靠性,自動(dòng)實(shí)現(xiàn)“去偽存真”的可靠性評(píng)價(jià)篩選。