專用術(shù)語(yǔ)無(wú)監(jiān)督聚類方法、裝置和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110921653.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113377929A | 公開(kāi)(公告)日 | 2021-09-10 |
申請(qǐng)公布號(hào) | CN113377929A | 申請(qǐng)公布日 | 2021-09-10 |
分類號(hào) | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I;G06K9/32(2006.01)N | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳冠偉 | 申請(qǐng)(專利權(quán))人 | 好心情健康產(chǎn)業(yè)集團(tuán)有限公司 |
代理機(jī)構(gòu) | 北京和信華成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 李瑩 |
地址 | 100080北京市海淀區(qū)北四環(huán)西路52號(hào)16層1601、1602房間 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)一種專用術(shù)語(yǔ)無(wú)監(jiān)督聚類方法、裝置和系統(tǒng),對(duì)文本進(jìn)行預(yù)處理,建立業(yè)務(wù)專用術(shù)語(yǔ)詞匯集合,所述集合包括詞匯的語(yǔ)義信息和詞序信息,詞匯由單詞組成,建立單詞?單詞的語(yǔ)義矩陣,對(duì)語(yǔ)義矩陣進(jìn)行模型預(yù)訓(xùn)練得到語(yǔ)義關(guān)系矩陣,計(jì)算單詞?單詞的詞序關(guān)系矩陣,通過(guò)無(wú)監(jiān)督聚類算法對(duì)語(yǔ)義關(guān)系矩陣和詞序關(guān)系矩陣進(jìn)行聚類,將單詞的語(yǔ)義信息和詞序信息通過(guò)關(guān)系矩陣的方式進(jìn)行提取,利用IRM算法對(duì)兩個(gè)關(guān)系矩陣進(jìn)行無(wú)監(jiān)督分類,完成單詞類別的提取。 |
