對(duì)問句語(yǔ)料進(jìn)行處理的方法、裝置以及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201911420583.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113127611A | 公開(公告)日 | 2021-07-16 |
申請(qǐng)公布號(hào) | CN113127611A | 申請(qǐng)公布日 | 2021-07-16 |
分類號(hào) | G06F16/332(2019.01)I;G06F16/35(2019.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 黃磊;楊春勇;靳丁南;權(quán)圣 | 申請(qǐng)(專利權(quán))人 | 北京中關(guān)村科金技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京萬(wàn)思博知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉冀 |
地址 | 100000北京市海淀區(qū)后屯南路26號(hào)4層5-03-2 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種對(duì)問句語(yǔ)料進(jìn)行處理的方法、裝置以及存儲(chǔ)介質(zhì)。其中,該方法包括,通過對(duì)第一問句語(yǔ)料集合進(jìn)行聚類操作,確定基于問句語(yǔ)料的多個(gè)問句類別,其中所述問句類別包含各自的根據(jù)問句語(yǔ)料的信息量確定的中心問句;根據(jù)第二問句語(yǔ)料集合中的問句語(yǔ)料與各個(gè)所述中心問句之間的相似度,確定所述第二問句語(yǔ)料集合中的問句語(yǔ)料的類別,并根據(jù)所述第二問句語(yǔ)料集合中的問句語(yǔ)料在所述多個(gè)問句類別的分布,確定各個(gè)所述中心問句的頻次;以及從多個(gè)問句類別中確定中心問句的頻次大于預(yù)設(shè)閾值的問句類別。 |
