一種基于詞向量句子鏈的文章論點論據(jù)自動檢測劃分方法

基本信息

申請?zhí)?/td> CN202010753418.5 申請日 -
公開(公告)號 CN111898375A 公開(公告)日 2020-11-06
申請公布號 CN111898375A 申請公布日 2020-11-06
分類號 G06F40/284(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張云;蔡博克;張京鵬;賁忠奇;冷若冰;闞野 申請(專利權(quán))人 混沌時代(北京)教育科技有限公司
代理機構(gòu) 北京魚爪知識產(chǎn)權(quán)代理有限公司 代理人 混沌時代(北京)教育科技有限公司
地址 100088北京市海淀區(qū)北三環(huán)中路44號4號樓4層406
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于詞向量句子鏈的文章論點論據(jù)自動檢測劃分方法,涉及自然語言處理領(lǐng)域。一種基于詞向量句子鏈的文章論點論據(jù)自動檢測劃分方法,包含:基于大量語料進行預(yù)訓(xùn)練,得到詞向量模型,詞向量模型為使用多組數(shù)據(jù)通過機器學(xué)習(xí)訓(xùn)練得到,其中,多組數(shù)據(jù)的每組均包含詞語及標(biāo)記詞語的語義的詞向量;獲取文章,并將文章進行分詞以分別提取每句的若干個詞語,將若干個詞語分別輸入詞向量模型以根據(jù)各詞語確認詞向量;獲取問題,并根據(jù)問題提取若干個關(guān)鍵詞,將若干個上述關(guān)鍵詞分別輸入詞向量模型以根據(jù)各上述關(guān)鍵詞確認詞向向。本發(fā)明能夠基于文章的問題查找文章中的論點和論據(jù),并且解決人工去標(biāo)注大量樣本造成耗力的問題。??