句模提取方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810964831.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109190099A 公開(kāi)(公告)日 2019-01-11
申請(qǐng)公布號(hào) CN109190099A 申請(qǐng)公布日 2019-01-11
分類號(hào) G06F17/24;G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 梅陽(yáng)陽(yáng);謝德剛;鄭文娟 申請(qǐng)(專利權(quán))人 上?;ソ讨悄芸萍加邢薰?/a>
代理機(jī)構(gòu) - 代理人 -
地址 201210 上海市浦東新區(qū)中國(guó)(上海)自由貿(mào)易試驗(yàn)區(qū)張江路368號(hào)29幢211室
法律狀態(tài) -

摘要

摘要 一種句模提取方法,用于對(duì)數(shù)學(xué)題目文本的句模提取,包括以下步驟:S1,首選進(jìn)行預(yù)處理,采用詞典與算法相結(jié)合的方法對(duì)數(shù)學(xué)題目進(jìn)行序列標(biāo)注、分詞和分句,并做標(biāo)準(zhǔn)化處理;S2,基于分詞和分句結(jié)果,計(jì)算詞對(duì)的互信息,初步篩選出句模,并根據(jù)句模出現(xiàn)次數(shù)確定句模。本發(fā)明根據(jù)數(shù)學(xué)短語(yǔ)化句式的特點(diǎn)和對(duì)文本序列標(biāo)注結(jié)果的預(yù)處理,可以有效地提取數(shù)學(xué)領(lǐng)域中的句子模板,大大提高了對(duì)數(shù)學(xué)題目知識(shí)表達(dá)的邏輯謂詞的提取效果,促進(jìn)了自動(dòng)解題系統(tǒng)對(duì)題意的準(zhǔn)確理解,相比傳統(tǒng)人工總結(jié)編寫(xiě)句模的方法適用性更廣,可以有效地推動(dòng)了自然語(yǔ)言處理領(lǐng)域中的關(guān)鍵技術(shù)針對(duì)數(shù)學(xué)領(lǐng)域的研究和應(yīng)用。