一種語(yǔ)料分類(lèi)方法、裝置及服務(wù)器

基本信息

申請(qǐng)?zhí)?/td> CN202010869820.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111984789A 公開(kāi)(公告)日 2020-11-24
申請(qǐng)公布號(hào) CN111984789A 申請(qǐng)公布日 2020-11-24
分類(lèi)號(hào) G06F16/35(2019.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 付紅雷;梁欣欣;井玉欣 申請(qǐng)(專(zhuān)利權(quán))人 普信恒業(yè)科技發(fā)展(北京)有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 普信恒業(yè)科技發(fā)展(北京)有限公司
地址 100026北京市朝陽(yáng)區(qū)西大望路1號(hào)1號(hào)樓16層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種語(yǔ)料分類(lèi)方法、裝置及服務(wù)器,該方法包括:獲取多個(gè)目標(biāo)語(yǔ)料集;確定每?jī)蓚€(gè)目標(biāo)語(yǔ)料集之間的語(yǔ)料距離,語(yǔ)料距離表征兩個(gè)不同目標(biāo)語(yǔ)料集之間的語(yǔ)義相似度;將語(yǔ)料距離符合預(yù)設(shè)距離條件的兩個(gè)目標(biāo)語(yǔ)料集執(zhí)行合并操作,得到合并后的語(yǔ)料集;將合并后的語(yǔ)料集以及未執(zhí)行合并操作的目標(biāo)語(yǔ)料集均作為新的目標(biāo)語(yǔ)料集,返回執(zhí)行所述確定每?jī)蓚€(gè)目標(biāo)語(yǔ)料集之間的語(yǔ)料距離的步驟,直到滿足預(yù)設(shè)分類(lèi)終止條件時(shí)終止操作,得到語(yǔ)料分類(lèi)結(jié)果。本發(fā)明通過(guò)循環(huán)執(zhí)行將語(yǔ)料距離符合預(yù)設(shè)距離條件的兩個(gè)目標(biāo)語(yǔ)料集進(jìn)行合并的操作,實(shí)現(xiàn)了依據(jù)語(yǔ)料距離對(duì)語(yǔ)料進(jìn)行自動(dòng)、快速分類(lèi)的目的,提高了語(yǔ)料分類(lèi)效率。??