基于NLP的調(diào)研數(shù)據(jù)標(biāo)準(zhǔn)化方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202110680101.8 | 申請日 | - |
公開(公告)號 | CN113326310A | 公開(公告)日 | 2021-08-31 |
申請公布號 | CN113326310A | 申請公布日 | 2021-08-31 |
分類號 | G06F16/25(2019.01)I;G06Q30/02(2012.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 周羽;張吳;黃海波;鄧莎 | 申請(專利權(quán))人 | 立信(重慶)數(shù)據(jù)科技股份有限公司 |
代理機(jī)構(gòu) | 重慶強(qiáng)大凱創(chuàng)專利代理事務(wù)所(普通合伙) | 代理人 | 冉劍俠 |
地址 | 401120重慶市渝北區(qū)仙桃數(shù)據(jù)谷東路19號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于數(shù)據(jù)處理領(lǐng)域,具體涉及基于NLP的調(diào)研數(shù)據(jù)標(biāo)準(zhǔn)化方法及系統(tǒng),該方法包括:標(biāo)準(zhǔn)庫制作步驟,創(chuàng)建標(biāo)準(zhǔn)庫,制定各研究領(lǐng)域的標(biāo)準(zhǔn)描述并存儲在標(biāo)準(zhǔn)庫中,標(biāo)準(zhǔn)描述包括研究領(lǐng)域標(biāo)準(zhǔn)描述、指標(biāo)標(biāo)準(zhǔn)描述及指標(biāo)選項(xiàng)標(biāo)準(zhǔn)描述;數(shù)據(jù)錄入步驟,錄入項(xiàng)目的調(diào)研數(shù)據(jù)及描述信息,描述信息包括領(lǐng)域描述、指標(biāo)描述及指標(biāo)選項(xiàng)描述;信息識別步驟,對錄入的描述信息分別進(jìn)行分詞后再進(jìn)行向量化得到詞向量,再利用LSTM對詞向量與標(biāo)準(zhǔn)庫進(jìn)行識別,根據(jù)計(jì)算出的相似度中選擇預(yù)設(shè)數(shù)量的相似度最高的標(biāo)準(zhǔn)描述;關(guān)聯(lián)確認(rèn)步驟,從識別出的標(biāo)準(zhǔn)描述中選擇出最準(zhǔn)確的一個,并將其與對應(yīng)的描述信息進(jìn)行關(guān)聯(lián)。本申請能夠在保證處理效率的同時保證處理的準(zhǔn)確率。 |
