一種影視類屬性數據源間的周期性實體匹配方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202111339282.4 申請日 -
公開(公告)號 CN113901264A 公開(公告)日 2022-01-07
申請公布號 CN113901264A 申請公布日 2022-01-07
分類號 G06F16/78(2019.01)I;G06F16/735(2019.01)I;G06F16/71(2019.01)I;G06F16/33(2019.01)I;G06N3/04(2006.01)I;G06K9/62(2006.01)I 分類 計算;推算;計數;
發(fā)明人 趙春光;李凱東;林楨杰;陳珊珊;李孟禹;趙亦喆 申請(專利權)人 央視頻融媒體發(fā)展有限公司
代理機構 北京高沃律師事務所 代理人 劉芳
地址 100026北京市朝陽區(qū)八里莊東里1號CN05
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種影視類屬性數據源間的周期性實體匹配方法及系統(tǒng),包括:向第一數據源中添加多條第一記錄;獲取對第二數據源構建的第一索引和第二索引;在索引中搜索第一記錄的標題和別名,得到多個候選記錄對;向第二數據源添加上述記錄對中的涉及的多條第二記錄;依次計算每個候選記錄對中第一記錄和第二記錄在各維度的相似度;將各維度相似度輸入相似度融合模型,得到綜合相似度;綜合相似度大于閾值則確定候選記錄對中第一記錄與第二記錄匹配成功,更新第一記錄的實體匹配狀態(tài)字典為匹配,并保存匹配成功的候選記錄對。本發(fā)明能在有限訓練數據資源、計算資源和存儲資源下,高效完成實體匹配任務,并且支持匹配結果的可解釋性。