基于NLP的調(diào)研數(shù)據(jù)標(biāo)準(zhǔn)化方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110680101.8 申請日 -
公開(公告)號 CN113326310A 公開(公告)日 2021-08-31
申請公布號 CN113326310A 申請公布日 2021-08-31
分類號 G06F16/25(2019.01)I;G06Q30/02(2012.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周羽;張吳;黃海波;鄧莎 申請(專利權(quán))人 立信(重慶)數(shù)據(jù)科技股份有限公司
代理機(jī)構(gòu) 重慶強(qiáng)大凱創(chuàng)專利代理事務(wù)所(普通合伙) 代理人 冉劍俠
地址 401120重慶市渝北區(qū)仙桃數(shù)據(jù)谷東路19號
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于數(shù)據(jù)處理領(lǐng)域,具體涉及基于NLP的調(diào)研數(shù)據(jù)標(biāo)準(zhǔn)化方法及系統(tǒng),該方法包括:標(biāo)準(zhǔn)庫制作步驟,創(chuàng)建標(biāo)準(zhǔn)庫,制定各研究領(lǐng)域的標(biāo)準(zhǔn)描述并存儲在標(biāo)準(zhǔn)庫中,標(biāo)準(zhǔn)描述包括研究領(lǐng)域標(biāo)準(zhǔn)描述、指標(biāo)標(biāo)準(zhǔn)描述及指標(biāo)選項(xiàng)標(biāo)準(zhǔn)描述;數(shù)據(jù)錄入步驟,錄入項(xiàng)目的調(diào)研數(shù)據(jù)及描述信息,描述信息包括領(lǐng)域描述、指標(biāo)描述及指標(biāo)選項(xiàng)描述;信息識別步驟,對錄入的描述信息分別進(jìn)行分詞后再進(jìn)行向量化得到詞向量,再利用LSTM對詞向量與標(biāo)準(zhǔn)庫進(jìn)行識別,根據(jù)計(jì)算出的相似度中選擇預(yù)設(shè)數(shù)量的相似度最高的標(biāo)準(zhǔn)描述;關(guān)聯(lián)確認(rèn)步驟,從識別出的標(biāo)準(zhǔn)描述中選擇出最準(zhǔn)確的一個,并將其與對應(yīng)的描述信息進(jìn)行關(guān)聯(lián)。本申請能夠在保證處理效率的同時保證處理的準(zhǔn)確率。