用于問答的數(shù)據(jù)處理方法以及裝置、設(shè)備、存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202010091290.0 | 申請日 | - |
公開(公告)號 | CN111274378A | 公開(公告)日 | 2020-06-12 |
申請公布號 | CN111274378A | 申請公布日 | 2020-06-12 |
分類號 | G06F16/332(2019.01)I | 分類 | - |
發(fā)明人 | 楊萌;杜振東;王清琛 | 申請(專利權(quán))人 | 南京云問網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京卓唐知識產(chǎn)權(quán)代理有限公司 | 代理人 | 南京云問網(wǎng)絡(luò)技術(shù)有限公司 |
地址 | 210000江蘇省南京市鼓樓區(qū)建寧路65號2樓203室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種用于問答的數(shù)據(jù)處理方法以及裝置、設(shè)備、存儲介質(zhì)。該方法包括獲取問答對數(shù)據(jù);根據(jù)所述問答對數(shù)據(jù),生成初始問答對集合;將所述初始問答對集合拆分為問題集合和答案集合;對所述問題集合聚類,提取得到問題簇集合;根據(jù)經(jīng)過預(yù)設(shè)處理后的問答對集合和所述問題簇集合,生成帶有答案的問題簇集合。本申請解決了對用于問答的數(shù)據(jù)沒有進(jìn)行較好利用的技術(shù)問題。通過本申請減少人工構(gòu)建知識的成本。同時抽取得到的熱點(diǎn)問答對,減少了企業(yè)根據(jù)文檔條例或者根據(jù)記憶編纂知識的人力成本,且生成的知識點(diǎn)即保證了豐富度。?? |
