一種基礎(chǔ)房型自動聚合方法

基本信息

申請?zhí)?/td> CN201710019360.X 申請日 -
公開(公告)號 CN106886565B 公開(公告)日 2020-02-11
申請公布號 CN106886565B 申請公布日 2020-02-11
分類號 G06F16/35;G06F40/284;G06Q50/12;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 張猛;楊洪偉;陳藝方;林小俊;陳文哲 申請(專利權(quán))人 北京眾薈信息技術(shù)股份有限公司
代理機構(gòu) 北京君尚知識產(chǎn)權(quán)代理有限公司 代理人 北京眾薈信息技術(shù)股份有限公司
地址 100088 北京市海淀區(qū)馬甸東路17號金澳國際大廈18層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基礎(chǔ)房型自動聚合方法。本方法為:1)對于同一家酒店,分別從兩不同來源上獲取該酒店的房型名稱數(shù)據(jù),每組房型名稱數(shù)據(jù)中包括多個基礎(chǔ)房型名稱;2)對每組房型名稱數(shù)據(jù)分別進行結(jié)構(gòu)化處理,得到該組房型名稱數(shù)據(jù)中每個房型名稱的結(jié)構(gòu)化信息;3)對步驟2)得到的所述結(jié)構(gòu)化信息中的元素進行兩兩組合并計算每一組合的匹配度;4)將基礎(chǔ)房型名稱兩兩組合生成若干候選聚合方案,得到一聚合方案候選集合;5)根據(jù)每一候選聚合方案中的各組合的匹配度,計算該候選聚合方案的綜合得分;將綜合得分最高的候選聚合方案做為最終聚合結(jié)果。相較于傳統(tǒng)的通過字符串相似度的聚合方式,本發(fā)明召回率提升了27%,準確率提高了5%。