一種通過文本分析自動(dòng)生成題庫知識(shí)點(diǎn)的方法

基本信息

申請(qǐng)?zhí)?/td> CN201610937043.1 申請(qǐng)日 -
公開(公告)號(hào) CN106570109B 公開(公告)日 2017-04-19
申請(qǐng)公布號(hào) CN106570109B 申請(qǐng)公布日 2017-04-19
分類號(hào) G06F16/35(2019.01)I 分類 -
發(fā)明人 羅登;萬享 申請(qǐng)(專利權(quán))人 深圳市點(diǎn)通數(shù)據(jù)有限公司
代理機(jī)構(gòu) 深圳市科吉華烽知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 代理人 深圳市點(diǎn)通數(shù)據(jù)有限公司
地址 518000廣東省深圳市福田區(qū)梅林閣小區(qū)001棟0302號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種通過文本分析自動(dòng)生成題庫知識(shí)點(diǎn)的方法,包括以下步驟:步驟S1,通過所有對(duì)文本樣本進(jìn)行分詞、統(tǒng)計(jì)和過濾,選取特征詞,組成特征詞表;步驟S2,分別對(duì)題干和題目解析進(jìn)行分詞,經(jīng)過特征詞表過濾分別得到題干和題目解析的特征詞,得到知識(shí)點(diǎn)分類;步驟S3,融合所述題干和題目解析這兩種數(shù)據(jù)源中的分類結(jié)果,進(jìn)而輸出最終的知識(shí)點(diǎn)分類結(jié)果。本發(fā)明通過卡方檢驗(yàn)分類和頻繁項(xiàng)集分類實(shí)現(xiàn)所述特征詞在知識(shí)點(diǎn)類別中的分類,并結(jié)合題目的題干和題目解析等信息來生成知識(shí)點(diǎn)分類的結(jié)果,能夠非常有效地提高知識(shí)點(diǎn)分類生成的準(zhǔn)確性;尤其針對(duì)知識(shí)點(diǎn)數(shù)目較多的情況,本發(fā)明依然能夠提高其正確率。??