文章原創(chuàng)檢查方法、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110452943.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113407684A 公開(kāi)(公告)日 2021-09-17
申請(qǐng)公布號(hào) CN113407684A 申請(qǐng)公布日 2021-09-17
分類(lèi)號(hào) G06F16/332(2019.01)I;G06F40/194(2020.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃康福;黎兆灃;夏雪 申請(qǐng)(專(zhuān)利權(quán))人 廣州盛成媽媽網(wǎng)絡(luò)科技股份有限公司
代理機(jī)構(gòu) 廣州市越秀區(qū)哲力專(zhuān)利商標(biāo)事務(wù)所(普通合伙) 代理人 曾令軍
地址 510000廣東省廣州市天河區(qū)天河路230號(hào)4301房(自編4305至4307室)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種文章原創(chuàng)檢查方法,包括:收到待檢測(cè)文章,并標(biāo)記所述文章的段落;根據(jù)標(biāo)點(diǎn)符號(hào)將段落拆分出多個(gè)句子;并將段落的首段和末段的每一句子、中間段落隨機(jī)選取一個(gè)句子放入待檢隊(duì)列;依次將所述待檢隊(duì)列的每一句子作為搜索關(guān)鍵詞在搜索引擎中搜索,獲取該句子對(duì)應(yīng)的搜索結(jié)果;對(duì)所述搜索結(jié)果去重后計(jì)算所述搜索結(jié)果與對(duì)應(yīng)的句子進(jìn)行相似度計(jì)算,獲得每一句子的相似度計(jì)算結(jié)果。此外還提供了文章原創(chuàng)檢查裝置及存儲(chǔ)介質(zhì)。本發(fā)明提供的技術(shù)方案,實(shí)現(xiàn)文章中的句子、段落、文章整體的相似度檢查及其量化,提升了文章原創(chuàng)檢查效率,且無(wú)須人為干預(yù),節(jié)省人力,同時(shí)檢查耗時(shí)短,結(jié)果判斷準(zhǔn)確。