一種相關(guān)文本片段搜索方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201810394787.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110413985A | 公開(公告)日 | 2019-11-05 |
申請(qǐng)公布號(hào) | CN110413985A | 申請(qǐng)公布日 | 2019-11-05 |
分類號(hào) | G06F17/27(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 何耀; 蔣松岐; 劉笑逸 | 申請(qǐng)(專利權(quán))人 | 北京海馬輕帆娛樂(lè)科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王寶筠 |
地址 | 100102 北京市朝陽(yáng)區(qū)望京SOHO塔2B座1508 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)實(shí)施例公開了一種文本片段檢索的方法及裝置,通過(guò)用文本片段中的特征詞的詞向量生成對(duì)應(yīng)于文本片段的詞向量矩陣,由于特征詞能夠體現(xiàn)文本片段的主要內(nèi)容,因此根據(jù)特征詞的詞向量生成的詞向量矩陣可以用來(lái)表示文本片段,用檢索詞的詞向量來(lái)表示檢索詞,計(jì)算各個(gè)詞向量矩陣與檢索詞的詞向量的相似度,通過(guò)詞向量矩陣和檢索詞的詞向量的相似度來(lái)表示文本片段和檢索詞的相似度,文本片段和檢索詞的相似度越高,說(shuō)明二者的相關(guān)度越高,將相似度大于或等于第一閾值的文本片段作為檢索結(jié)果,從而提高對(duì)相關(guān)文本片段的檢索的準(zhǔn)確性。 |
