樣本量數(shù)據(jù)提取方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111052101.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113836892A 公開(kāi)(公告)日 2021-12-24
申請(qǐng)公布號(hào) CN113836892A 申請(qǐng)公布日 2021-12-24
分類(lèi)號(hào) G06F40/211(2020.01)I;G06F40/242(2020.01)I;G06F16/35(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G16H10/20(2018.01)I;G16H70/00(2018.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王則遠(yuǎn);周永杰 申請(qǐng)(專(zhuān)利權(quán))人 靈犀量子(北京)醫(yī)療科技有限公司
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王宇楊
地址 100161北京市豐臺(tái)區(qū)南四環(huán)西路186號(hào)四區(qū)5號(hào)樓5層09室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種樣本量數(shù)據(jù)提取方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該方法包括:通過(guò)預(yù)設(shè)規(guī)則將臨床研究文獻(xiàn)分為關(guān)鍵句可提取臨床研究文獻(xiàn)和關(guān)鍵句不可提取臨床研究文獻(xiàn);通過(guò)預(yù)設(shè)分句規(guī)則將關(guān)鍵句可提取臨床研究文獻(xiàn)的摘要數(shù)據(jù)進(jìn)行分句,得到方法數(shù)據(jù)的第一關(guān)鍵句數(shù)據(jù);將方法數(shù)據(jù)和非方法數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集對(duì)第一預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到數(shù)據(jù)抽取模型,基于數(shù)據(jù)抽取模型提取關(guān)鍵句不可提取臨床研究文獻(xiàn),得到第二關(guān)鍵句數(shù)據(jù);將第一關(guān)鍵句數(shù)據(jù)和第二關(guān)鍵句數(shù)據(jù)作為關(guān)鍵句數(shù)據(jù)集合對(duì)第二預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到數(shù)據(jù)生成模型,基于數(shù)據(jù)生成模型生成樣本量數(shù)據(jù)。本發(fā)明通過(guò)數(shù)據(jù)抽取模型和數(shù)據(jù)生成模型提取數(shù)據(jù),提升了樣本量數(shù)據(jù)的準(zhǔn)確性。