一種結(jié)合語義識(shí)別實(shí)現(xiàn)標(biāo)識(shí)文本差異內(nèi)容的方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110562368.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113051869A | 公開(公告)日 | 2021-06-29 |
申請(qǐng)公布號(hào) | CN113051869A | 申請(qǐng)公布日 | 2021-06-29 |
分類號(hào) | G06F40/106;G06F40/284;G06F40/30;G06K9/62;G06F16/33 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張利江;滕菁;孫長(zhǎng)磊;蔣濤 | 申請(qǐng)(專利權(quán))人 | 浙江有數(shù)數(shù)智科技有限公司 |
代理機(jī)構(gòu) | 北京崇智知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 馬良 |
地址 | 310000 浙江省杭州市江干區(qū)九環(huán)路九號(hào)4號(hào)樓8樓808室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種結(jié)合語義識(shí)別實(shí)現(xiàn)標(biāo)識(shí)文本差異內(nèi)容的方法,包括:S100:通過深度學(xué)習(xí)方法預(yù)訓(xùn)練所述相似度計(jì)算模型;S200:計(jì)算待對(duì)比文本的第一相似度;S300:逐個(gè)隨機(jī)剔除待對(duì)比文本中的分詞;S400:計(jì)算剔除分詞之后的待對(duì)比文的第二相似度;S500:當(dāng)?shù)诙嗨贫刃∮陬A(yù)設(shè)相似度閾值且大于第一相似度時(shí),重復(fù)步驟S300;S600:當(dāng)?shù)诙嗨贫刃∮诘谝幌嗨贫葧r(shí),放回被剔除的分詞后,重復(fù)步驟S300;S700:當(dāng)?shù)诙嗨贫却笥诨虻扔陬A(yù)設(shè)相似度閾值時(shí),標(biāo)識(shí)待對(duì)比文本中被剔除的分詞。本申請(qǐng)可以在保留語義的前提下,提取出兩句文本中不同的內(nèi)容,并對(duì)不同的內(nèi)容進(jìn)行高亮展示,準(zhǔn)確高效的提取到使用者關(guān)注的核心要素,從而提升使用者的工作效率。 |
