一種基于圖片問答的處理方法
基本信息
申請?zhí)?/td> | CN202210321278.3 | 申請日 | - |
公開(公告)號 | CN114416914B | 公開(公告)日 | 2022-07-08 |
申請公布號 | CN114416914B | 申請公布日 | 2022-07-08 |
分類號 | G06F16/31(2019.01)I;G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F40/279(2020.01)I;G06Q30/06(2012.01)I;G06V30/40(2022.01)I;G06N3/08(2006.01)I;CN 111930887 A,2020.11.13;CN 110647629 A,2020.01.03;US 2020090539 A1,2020.03.19;CN 112800191 A,2021.05.14;CN 107609056 A,2018.01.19;CN 113761153 A,2021.12.07;CN 114155530 A,2022.03.08;CN 113360699 A,2021.09.07;CN 113886626 A,2022.01.04;CN 113656570 A,2021.11.16;CN 113407663 A,2021.09.17 鄭偉曼.“基于圖像場景圖的視覺問答方法的研究”.《中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫 信息科技輯》.2022,;李根.“基于預(yù)訓練的跨模態(tài)統(tǒng)一模型研究”.《中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫 信息科技輯》.2020,;李慶.“基于深度神經(jīng)網(wǎng)絡(luò)和注意力機制的圖像問答研究”.《中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫 信息科技輯》.2019,;Linjie Li 等.“Relation-Aware Graph Attention Network for Visual Question Answering”.《2019 IEEE/CVF International Conference on Computer Vision (ICCV)》.2020, | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 谷滿昌;張鏡;馬洋 | 申請(專利權(quán))人 | 中建電子商務(wù)有限責任公司 |
代理機構(gòu) | 成都春夏知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | - |
地址 | 610000四川省成都市青羊區(qū)騰飛大道51號18棟12層1202號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及圖片問答處理技術(shù)領(lǐng)域,公開了一種基于圖片問答的處理方法,該方法包括:對商品詳情頁進行OCR光學識別,獲取第一段落;將第一段落和用戶問題分為有序的單詞序列,通過信息檢索獲取最相關(guān)的K個第二段落;將用戶問題和K個第二段落分別進行分詞;將用戶問題分別和每個第二段落進行拼接,并在用戶問題前加入標記位得到第三段落,對第三段落進行建模,構(gòu)造多個輸入向量;用相加后的輸入向量表示第三段落,輸入到中文預(yù)訓練模型,將中文預(yù)訓練模型的最終隱藏狀態(tài)轉(zhuǎn)化為答案跨度概率值。本申請的技術(shù)方案提高圖片問答用戶體驗,同時也節(jié)約了商家的配置答案的成本,提升了圖片問答效率。 |
