一種試題自動標注錄入方法
基本信息
申請?zhí)?/td> | CN202010032609.2 | 申請日 | - |
公開(公告)號 | CN111209728A | 公開(公告)日 | 2020-05-29 |
申請公布號 | CN111209728A | 申請公布日 | 2020-05-29 |
分類號 | G06F40/169;G06F40/151;G06F40/284 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 楊立春;夏德虎;張志發(fā);趙夢凱;鞏稼民;蔣杰偉;張凱澤;楊紅蕊;馬豆豆;劉愛萍 | 申請(專利權(quán))人 | 深圳市企鵝網(wǎng)絡(luò)科技有限公司 |
代理機構(gòu) | 廣州潤禾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 西安郵電大學(xué);深圳市企鵝網(wǎng)絡(luò)科技有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)西麗街道松坪山社區(qū)松坪山朗山路16號華瀚創(chuàng)新園辦公樓D座6樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種試題自動標注錄入方法,包括:將word試題文檔自動轉(zhuǎn)換成對應(yīng)的html文檔并存儲所述html文檔;自動提取html文檔的文本內(nèi)容;采用統(tǒng)計模型中的n元語法模型對所述文本內(nèi)容進行詞語分割,使用隱馬爾可夫模型對分割后的詞語進行詞性標注;對標注好詞性的詞語進行試題特征提取,判斷所述詞語的特征是否與預(yù)設(shè)的試題關(guān)鍵字的特征對應(yīng),是則對所述詞語進行關(guān)鍵字標注及標記所述詞語在文本中的位置;根據(jù)題號關(guān)鍵字對試題進行逐題分割;根據(jù)逐題分割好的關(guān)鍵字及所述關(guān)鍵字在文本中的位置在試題構(gòu)造模塊中對試題進行組裝,將組裝好的試題存儲到對應(yīng)的位置。本發(fā)明有效地提高了試題自動錄入的準確率,同時解決了無法自動錄入帶有圖片或公式的問題。 |
