一種試題自動(dòng)標(biāo)注錄入方法

基本信息

申請(qǐng)?zhí)?/td> CN202010032609.2 申請(qǐng)日 -
公開(公告)號(hào) CN111209728A 公開(公告)日 2020-05-29
申請(qǐng)公布號(hào) CN111209728A 申請(qǐng)公布日 2020-05-29
分類號(hào) G06F40/169;G06F40/151;G06F40/284 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊立春;夏德虎;張志發(fā);趙夢(mèng)凱;鞏稼民;蔣杰偉;張凱澤;楊紅蕊;馬豆豆;劉愛萍 申請(qǐng)(專利權(quán))人 深圳市企鵝網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 廣州潤(rùn)禾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 西安郵電大學(xué);深圳市企鵝網(wǎng)絡(luò)科技有限公司
地址 518000 廣東省深圳市南山區(qū)西麗街道松坪山社區(qū)松坪山朗山路16號(hào)華瀚創(chuàng)新園辦公樓D座6樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種試題自動(dòng)標(biāo)注錄入方法,包括:將word試題文檔自動(dòng)轉(zhuǎn)換成對(duì)應(yīng)的html文檔并存儲(chǔ)所述html文檔;自動(dòng)提取html文檔的文本內(nèi)容;采用統(tǒng)計(jì)模型中的n元語法模型對(duì)所述文本內(nèi)容進(jìn)行詞語分割,使用隱馬爾可夫模型對(duì)分割后的詞語進(jìn)行詞性標(biāo)注;對(duì)標(biāo)注好詞性的詞語進(jìn)行試題特征提取,判斷所述詞語的特征是否與預(yù)設(shè)的試題關(guān)鍵字的特征對(duì)應(yīng),是則對(duì)所述詞語進(jìn)行關(guān)鍵字標(biāo)注及標(biāo)記所述詞語在文本中的位置;根據(jù)題號(hào)關(guān)鍵字對(duì)試題進(jìn)行逐題分割;根據(jù)逐題分割好的關(guān)鍵字及所述關(guān)鍵字在文本中的位置在試題構(gòu)造模塊中對(duì)試題進(jìn)行組裝,將組裝好的試題存儲(chǔ)到對(duì)應(yīng)的位置。本發(fā)明有效地提高了試題自動(dòng)錄入的準(zhǔn)確率,同時(shí)解決了無法自動(dòng)錄入帶有圖片或公式的問題。