生成內(nèi)容標(biāo)簽的方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201410531163.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN105488077B | 公開(kāi)(公告)日 | 2020-04-28 |
申請(qǐng)公布號(hào) | CN105488077B | 申請(qǐng)公布日 | 2020-04-28 |
分類號(hào) | G06F16/38;G06F40/289;G06F40/30 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 連鳳宗;軒文烽 | 申請(qǐng)(專利權(quán))人 | 騰訊音樂(lè)(北京)有限公司 |
代理機(jī)構(gòu) | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 | 代理人 | 騰訊科技(深圳)有限公司 |
地址 | 518000 廣東省深圳市福田區(qū)振興路賽格科技園2棟東403室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種生成內(nèi)容標(biāo)簽的方法和裝置,該方法包括:將用戶生成內(nèi)容進(jìn)行分詞處理而獲得分詞片段序列;根據(jù)所述分詞片段序列中多個(gè)相鄰的分詞片段在預(yù)設(shè)語(yǔ)料庫(kù)中共同出現(xiàn)的次數(shù),將具備合并條件的多個(gè)相鄰的分詞片段合并以獲得語(yǔ)義片段的集合;從所述語(yǔ)義片段的集合中過(guò)濾掉預(yù)設(shè)的無(wú)語(yǔ)義片段;將所述語(yǔ)義片段的集合中剩余的語(yǔ)義片段確定為內(nèi)容標(biāo)簽。本發(fā)明提供的生成內(nèi)容標(biāo)簽的方法和裝置生成的內(nèi)容標(biāo)簽符合大多數(shù)用戶的自由語(yǔ)言的描述,可以更好地命中查詢?cè)~,使得基于該內(nèi)容標(biāo)簽的內(nèi)容搜索更加高效。 |
