一種基于圖譜的搜索分析方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110553773.2 申請日 -
公開(公告)號 CN113220975A 公開(公告)日 2021-08-06
申請公布號 CN113220975A 申請公布日 2021-08-06
分類號 G06F16/9532(2019.01)I;G06F40/58(2020.01)I;G06F40/295(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王緒剛;李玨;李新貴 申請(專利權(quán))人 北京歐拉認(rèn)知智能科技有限公司
代理機(jī)構(gòu) 北京匯信合知識產(chǎn)權(quán)代理有限公司 代理人 林聰源
地址 100086北京市海淀區(qū)中關(guān)村南大街6號9層913
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于圖譜的搜索分析方法及系統(tǒng),涉及計(jì)算機(jī)技術(shù)領(lǐng)域,包括搜集數(shù)據(jù)集,獲取到中英對齊的中英雙語句子;構(gòu)建Transformer翻譯模型,將獲取到的中英雙語句子輸入Transformer翻譯模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的中英翻譯模型;基于中英翻譯模型進(jìn)行實(shí)體抽取、翻譯,得到對齊的中英雙語實(shí)體;根據(jù)中英雙語實(shí)體構(gòu)建關(guān)聯(lián)關(guān)系,經(jīng)映射獲得底層關(guān)系圖譜;根據(jù)用戶輸入的搜索語句進(jìn)行實(shí)體抽取、翻譯,并與底層關(guān)系圖譜進(jìn)行匹配,得到搜索結(jié)果。本發(fā)明通過構(gòu)建中英翻譯模型,提供一個(gè)供應(yīng)用層調(diào)用的底層關(guān)系圖譜,在用戶輸入搜索語句后,基于底層關(guān)系圖譜實(shí)現(xiàn)對搜索語句的雙語言精準(zhǔn)搜索,有效解決跨語言搜索的問題,提高了翻譯搜索結(jié)果的準(zhǔn)確率。