短語挖掘方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201610388226.2 申請(qǐng)日 -
公開(公告)號(hào) CN107463548B 公開(公告)日 2021-04-27
申請(qǐng)公布號(hào) CN107463548B 申請(qǐng)公布日 2021-04-27
分類號(hào) G06F40/289;G06F40/47 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 史黎鑫;張海波;趙宇;駱衛(wèi)華;林鋒;卞華明;管陶然;劉禹 申請(qǐng)(專利權(quán))人 阿里巴巴(中國)網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李威;林祥
地址 浙江省杭州市濱江區(qū)網(wǎng)商路699號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┮环N短語挖掘方法及裝置,該方法可以包括:通過預(yù)配置的組合策略從原始語料中抽取候選短語集合,所述候選短語集合中包含若干候選短語,且所述候選短語對(duì)應(yīng)于所述組合策略中的至少一個(gè)子策略;從所述候選短語集合中,篩選出滿足預(yù)設(shè)質(zhì)量條件的短語。通過本申請(qǐng)的技術(shù)方案,可以擴(kuò)展候選短語集合的覆蓋度,避免漏失潛在的高質(zhì)量短語,以實(shí)現(xiàn)對(duì)高質(zhì)量短語的準(zhǔn)確挖掘。