代碼文本處理方法及相關產品

基本信息

申請?zhí)?/td> CN201911290957.3 申請日 -
公開(公告)號 CN111126031A 公開(公告)日 2020-05-08
申請公布號 CN111126031A 申請公布日 2020-05-08
分類號 G06F40/194;G06F8/75 分類 計算;推算;計數;
發(fā)明人 于俊;連順;李雅潔;譚昶;謝榭;丁輝 申請(專利權)人 南京謙萃智能科技服務有限公司
代理機構 廣州三環(huán)專利商標代理有限公司 代理人 南京謙萃智能科技服務有限公司
地址 210000 江蘇省南京市建鄴區(qū)江心州賢坤路1號科創(chuàng)中心2樓220-50號辦公用房
法律狀態(tài) -

摘要

摘要 本申請實施例公開了一種代碼文本處理方法及相關產品,方法包括:首先獲取兩個第一代碼文本,之后,確定兩個第一代碼文本中每個第一代碼文本的第一文本特征,第一文本特征用于表征文本的結構特征,結構特征用于反映文本的組成成分,然后,將兩個第一代碼文本導入預先訓練好的文本特征提取模型,得到兩個第一代碼文本中每個第一代碼文本的第二文本特征,第二文本特征用于表征文本的語義特征,最后,根據兩個第一代碼文本的第一文本特征和第二文本特征,得到兩個第一代碼文本對應的目標相似度。本申請實施例有利于提升代碼文本相似性計算的精準度。