一種基于圖片問(wèn)答的處理方法
基本信息
申請(qǐng)?zhí)?/td> | CN202210321278.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114416914B | 公開(kāi)(公告)日 | 2022-07-08 |
申請(qǐng)公布號(hào) | CN114416914B | 申請(qǐng)公布日 | 2022-07-08 |
分類(lèi)號(hào) | G06F16/31(2019.01)I;G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F40/279(2020.01)I;G06Q30/06(2012.01)I;G06V30/40(2022.01)I;G06N3/08(2006.01)I;CN 111930887 A,2020.11.13;CN 110647629 A,2020.01.03;US 2020090539 A1,2020.03.19;CN 112800191 A,2021.05.14;CN 107609056 A,2018.01.19;CN 113761153 A,2021.12.07;CN 114155530 A,2022.03.08;CN 113360699 A,2021.09.07;CN 113886626 A,2022.01.04;CN 113656570 A,2021.11.16;CN 113407663 A,2021.09.17 鄭偉曼.“基于圖像場(chǎng)景圖的視覺(jué)問(wèn)答方法的研究”.《中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 信息科技輯》.2022,;李根.“基于預(yù)訓(xùn)練的跨模態(tài)統(tǒng)一模型研究”.《中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 信息科技輯》.2020,;李慶.“基于深度神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的圖像問(wèn)答研究”.《中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 信息科技輯》.2019,;Linjie Li 等.“Relation-Aware Graph Attention Network for Visual Question Answering”.《2019 IEEE/CVF International Conference on Computer Vision (ICCV)》.2020, | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 谷滿昌;張鏡;馬洋 | 申請(qǐng)(專(zhuān)利權(quán))人 | 中建電子商務(wù)有限責(zé)任公司 |
代理機(jī)構(gòu) | 成都春夏知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | - |
地址 | 610000四川省成都市青羊區(qū)騰飛大道51號(hào)18棟12層1202號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及圖片問(wèn)答處理技術(shù)領(lǐng)域,公開(kāi)了一種基于圖片問(wèn)答的處理方法,該方法包括:對(duì)商品詳情頁(yè)進(jìn)行OCR光學(xué)識(shí)別,獲取第一段落;將第一段落和用戶問(wèn)題分為有序的單詞序列,通過(guò)信息檢索獲取最相關(guān)的K個(gè)第二段落;將用戶問(wèn)題和K個(gè)第二段落分別進(jìn)行分詞;將用戶問(wèn)題分別和每個(gè)第二段落進(jìn)行拼接,并在用戶問(wèn)題前加入標(biāo)記位得到第三段落,對(duì)第三段落進(jìn)行建模,構(gòu)造多個(gè)輸入向量;用相加后的輸入向量表示第三段落,輸入到中文預(yù)訓(xùn)練模型,將中文預(yù)訓(xùn)練模型的最終隱藏狀態(tài)轉(zhuǎn)化為答案跨度概率值。本申請(qǐng)的技術(shù)方案提高圖片問(wèn)答用戶體驗(yàn),同時(shí)也節(jié)約了商家的配置答案的成本,提升了圖片問(wèn)答效率。 |
