一種基于詞向量句子鏈的文章論點論據(jù)自動檢測劃分方法
基本信息
申請?zhí)?/td> | CN202010753418.5 | 申請日 | - |
公開(公告)號 | CN111898375A | 公開(公告)日 | 2020-11-06 |
申請公布號 | CN111898375A | 申請公布日 | 2020-11-06 |
分類號 | G06F40/284(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張云;蔡博克;張京鵬;賁忠奇;冷若冰;闞野 | 申請(專利權(quán))人 | 混沌時代(北京)教育科技有限公司 |
代理機構(gòu) | 北京魚爪知識產(chǎn)權(quán)代理有限公司 | 代理人 | 混沌時代(北京)教育科技有限公司 |
地址 | 100088北京市海淀區(qū)北三環(huán)中路44號4號樓4層406 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種基于詞向量句子鏈的文章論點論據(jù)自動檢測劃分方法,涉及自然語言處理領(lǐng)域。一種基于詞向量句子鏈的文章論點論據(jù)自動檢測劃分方法,包含:基于大量語料進行預(yù)訓(xùn)練,得到詞向量模型,詞向量模型為使用多組數(shù)據(jù)通過機器學(xué)習(xí)訓(xùn)練得到,其中,多組數(shù)據(jù)的每組均包含詞語及標(biāo)記詞語的語義的詞向量;獲取文章,并將文章進行分詞以分別提取每句的若干個詞語,將若干個詞語分別輸入詞向量模型以根據(jù)各詞語確認詞向量;獲取問題,并根據(jù)問題提取若干個關(guān)鍵詞,將若干個上述關(guān)鍵詞分別輸入詞向量模型以根據(jù)各上述關(guān)鍵詞確認詞向向。本發(fā)明能夠基于文章的問題查找文章中的論點和論據(jù),并且解決人工去標(biāo)注大量樣本造成耗力的問題。?? |
