一種智能處理圖文方法以及處理圖文系統(tǒng)

基本信息

申請?zhí)?/td> CN201811436923.6 申請日 -
公開(公告)號 CN111241383A 公開(公告)日 2020-06-05
申請公布號 CN111241383A 申請公布日 2020-06-05
分類號 G06F16/9535(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 潘衛(wèi);徐閬平;錢浩亮 申請(專利權)人 上海花事電子商務有限公司
代理機構 上海宏京知識產(chǎn)權代理事務所(普通合伙) 代理人 鄧文武
地址 201799上海市青浦區(qū)滬青平公路3841弄5號67宗地29幢二層I區(qū)285室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種智能處理圖文方法,包括以下步驟:步驟一:通過創(chuàng)建爬蟲框架爬取各大開源媒體網(wǎng)站的最新圖文數(shù)據(jù);步驟二:處理該圖文數(shù)據(jù)將重復內容刪除并提取關鍵詞,計算該圖文數(shù)據(jù)中各文章的相似度并對相似度高的文章進行標記;步驟三:提取該圖文數(shù)據(jù)中文章的語義進行頻道的分配;步驟四:對分配好的文章進行過濾;步驟五:依據(jù)文章中的圖片進行打分并選取分數(shù)前三的圖片,當圖片少于三張時選擇分數(shù)最高的一張圖片,對該圖片進行圖像處理生成高質量的封面;步驟六:對文章中的圖片增加水印,將文章、圖片、封片、關鍵詞整合形成圖文處理數(shù)據(jù);步驟七:對該圖文處理數(shù)據(jù)進行審核與分類;步驟八:依據(jù)分類后的圖文數(shù)據(jù)推薦至相應的用戶端。??