短語挖掘方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201610388226.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN107463548B | 公開(公告)日 | 2021-04-27 |
申請(qǐng)公布號(hào) | CN107463548B | 申請(qǐng)公布日 | 2021-04-27 |
分類號(hào) | G06F40/289;G06F40/47 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 史黎鑫;張海波;趙宇;駱衛(wèi)華;林鋒;卞華明;管陶然;劉禹 | 申請(qǐng)(專利權(quán))人 | 阿里巴巴(中國)網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李威;林祥 |
地址 | 浙江省杭州市濱江區(qū)網(wǎng)商路699號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┮环N短語挖掘方法及裝置,該方法可以包括:通過預(yù)配置的組合策略從原始語料中抽取候選短語集合,所述候選短語集合中包含若干候選短語,且所述候選短語對(duì)應(yīng)于所述組合策略中的至少一個(gè)子策略;從所述候選短語集合中,篩選出滿足預(yù)設(shè)質(zhì)量條件的短語。通過本申請(qǐng)的技術(shù)方案,可以擴(kuò)展候選短語集合的覆蓋度,避免漏失潛在的高質(zhì)量短語,以實(shí)現(xiàn)對(duì)高質(zhì)量短語的準(zhǔn)確挖掘。 |
