基于embedding方法的意圖識(shí)別算法

基本信息

申請(qǐng)?zhí)?/td> CN201910141203.5 申請(qǐng)日 -
公開(公告)號(hào) CN109933663A 公開(公告)日 2019-06-25
申請(qǐng)公布號(hào) CN109933663A 申請(qǐng)公布日 2019-06-25
分類號(hào) G06F16/35(2019.01)I; G06K9/62(2006.01)I; G06N3/04(2006.01)I; G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫曉明 申請(qǐng)(專利權(quán))人 上海凱岸信息科技有限公司
代理機(jī)構(gòu) 上海海貝律師事務(wù)所 代理人 上海凱岸信息科技有限公司
地址 201808 上海市嘉定區(qū)嘉羅公路1661弄12號(hào)101室-16
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于embedding方法的意圖識(shí)別算法,基于特定領(lǐng)域內(nèi)的數(shù)據(jù),將用戶的輸入文本與意圖映射到相同的向量空間,使得用戶的輸入文本與用戶意圖可以在同一空間內(nèi)進(jìn)行相似度對(duì)比,將分類問(wèn)題轉(zhuǎn)化了排序問(wèn)題;通過(guò)將語(yǔ)句和意圖映射到相同的向量空間將意圖分類問(wèn)題轉(zhuǎn)換為意圖排序問(wèn)題;對(duì)論文中的損失函數(shù)進(jìn)行修改,使得新的損失函數(shù)具有更好的穩(wěn)定性和魯棒性;本發(fā)明提供的基于embedding方法的意圖識(shí)別算法,在通用數(shù)據(jù)集上預(yù)訓(xùn)練的詞向量需要占用上GB的內(nèi)存空間,而本申請(qǐng)方案提供的模型由于只是嵌入了所關(guān)心的詞和意圖,因此僅需100MB左右的內(nèi)存空間,占用的內(nèi)存空間更少。