面向金融行業(yè)軟件測(cè)試基于知識(shí)圖譜語(yǔ)義相似度計(jì)算方法

基本信息

申請(qǐng)?zhí)?/td> CN201910010902.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110232185A 公開(kāi)(公告)日 2019-09-13
申請(qǐng)公布號(hào) CN110232185A 申請(qǐng)公布日 2019-09-13
分類號(hào) G06F17/27(2006.01)I; G06F17/22(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 杜廣龍; 陳震星; 李方; 周文沛; 孫慧; 姚庚成 申請(qǐng)(專利權(quán))人 上海中軟華騰軟件系統(tǒng)有限公司
代理機(jī)構(gòu) 廣州粵高專利商標(biāo)代理有限公司 代理人 何淑珍;江裕強(qiáng)
地址 510640 廣東省廣州市天河區(qū)五山路381號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種面向金融行業(yè)軟件測(cè)試基于知識(shí)圖譜語(yǔ)義相似度計(jì)算方法,包括步驟:S1對(duì)金融文本進(jìn)行分詞操作;S2選取與文本主題性最相關(guān)的分詞組合;S3利用知識(shí)圖譜和使用概念I(lǐng)C加權(quán)最小路徑長(zhǎng)度對(duì)分詞組合計(jì)算語(yǔ)義相似度。基于知識(shí)圖譜的自然語(yǔ)義檢測(cè)算法首先利用多種分詞算法對(duì)金融文本進(jìn)行分詞切割得到分詞組合,接著計(jì)算詞語(yǔ)和文本關(guān)鍵字的概念距離來(lái)測(cè)量分詞組合和文本主題間的相似度,最后選取概念距離之和最小的分詞組合進(jìn)行語(yǔ)義相似度檢測(cè)。知識(shí)圖譜中使用概念的信息IC來(lái)加權(quán)概念之間的最短路徑長(zhǎng)度,在準(zhǔn)確性上相對(duì)于其他方法表現(xiàn)出更好的性能。