一種半監(jiān)督的領域詞挖掘與分類的方法和設備

基本信息

申請?zhí)?/td> CN201710748366.0 申請日 -
公開(公告)號 CN107577739B 公開(公告)日 2020-04-10
申請公布號 CN107577739B 申請公布日 2020-04-10
分類號 G06F16/33;G06F16/35;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 高登科;姚佳 申請(專利權)人 廣東惠禾科技發(fā)展有限公司
代理機構 北京超凡志成知識產(chǎn)權代理事務所(普通合伙) 代理人 深圳市空谷幽蘭人工智能科技有限公司;廣東惠禾科技發(fā)展有限公司
地址 518054 廣東省深圳市南山區(qū)粵海街道學府路2388號怡化金融科技大廈14樓01-02單元
法律狀態(tài) -

摘要

摘要 本發(fā)明實例提出了一種半監(jiān)督的領域詞挖掘與分類的方法和設備,其中該方法包括:對領域相關語料進行預處理以及構建種子詞表和詞語相似度矩陣,挖掘候選領域詞以及確定候選領域詞的相似度分布,對篩選出的領域詞進行類別的標記;以此通過半監(jiān)督的方式,無需大量標注數(shù)據(jù),只需要基于一般的領域文本和少量種子詞表即可完成領域詞的挖掘與分類。