基于embedding方法的意圖識(shí)別算法
基本信息
申請(qǐng)?zhí)?/td> | CN201910141203.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109933663A | 公開(公告)日 | 2019-06-25 |
申請(qǐng)公布號(hào) | CN109933663A | 申請(qǐng)公布日 | 2019-06-25 |
分類號(hào) | G06F16/35(2019.01)I; G06K9/62(2006.01)I; G06N3/04(2006.01)I; G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 孫曉明 | 申請(qǐng)(專利權(quán))人 | 上海凱岸信息科技有限公司 |
代理機(jī)構(gòu) | 上海海貝律師事務(wù)所 | 代理人 | 上海凱岸信息科技有限公司 |
地址 | 201808 上海市嘉定區(qū)嘉羅公路1661弄12號(hào)101室-16 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于embedding方法的意圖識(shí)別算法,基于特定領(lǐng)域內(nèi)的數(shù)據(jù),將用戶的輸入文本與意圖映射到相同的向量空間,使得用戶的輸入文本與用戶意圖可以在同一空間內(nèi)進(jìn)行相似度對(duì)比,將分類問(wèn)題轉(zhuǎn)化了排序問(wèn)題;通過(guò)將語(yǔ)句和意圖映射到相同的向量空間將意圖分類問(wèn)題轉(zhuǎn)換為意圖排序問(wèn)題;對(duì)論文中的損失函數(shù)進(jìn)行修改,使得新的損失函數(shù)具有更好的穩(wěn)定性和魯棒性;本發(fā)明提供的基于embedding方法的意圖識(shí)別算法,在通用數(shù)據(jù)集上預(yù)訓(xùn)練的詞向量需要占用上GB的內(nèi)存空間,而本申請(qǐng)方案提供的模型由于只是嵌入了所關(guān)心的詞和意圖,因此僅需100MB左右的內(nèi)存空間,占用的內(nèi)存空間更少。 |
