一種用于輔助調(diào)查訪談的語(yǔ)料庫(kù)積累方法

基本信息

申請(qǐng)?zhí)?/td> CN202011089200.0 申請(qǐng)日 -
公開(公告)號(hào) CN112214586B 公開(公告)日 2022-06-28
申請(qǐng)公布號(hào) CN112214586B 申請(qǐng)公布日 2022-06-28
分類號(hào) G06F16/332(2019.01)I;G10L15/26(2006.01)I;G06N20/00(2019.01)I;G06F40/194(2020.01)I;G06F16/31(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姚占雷;周謙豪;許鑫 申請(qǐng)(專利權(quán))人 華東師范大學(xué)
代理機(jī)構(gòu) 上海藍(lán)迪專利商標(biāo)事務(wù)所(普通合伙) 代理人 -
地址 200241上海市閔行區(qū)東川路500號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種用于輔助調(diào)查訪談的語(yǔ)料庫(kù)積累方法,其特點(diǎn)是采用領(lǐng)域語(yǔ)料向通用語(yǔ)料有條件轉(zhuǎn)化的積累機(jī)制的方法,將頻繁出現(xiàn)新的相似語(yǔ)料的領(lǐng)域語(yǔ)料轉(zhuǎn)化為通用語(yǔ)料,其情景化的語(yǔ)料庫(kù)積累具體包括:接收用戶輸入、通用語(yǔ)料的追加積累、領(lǐng)域情景語(yǔ)料的追加積累和領(lǐng)域語(yǔ)料向通用語(yǔ)料有條件轉(zhuǎn)化的積累等步驟。本發(fā)明與現(xiàn)有技術(shù)相比具領(lǐng)域語(yǔ)料庫(kù)和通用語(yǔ)料庫(kù)分離并存,進(jìn)一步明確領(lǐng)域?qū)S姓Z(yǔ)料的邊界,降低建立基于專家知識(shí)的規(guī)則的信息抽取系統(tǒng)的成本,有助于提供包含領(lǐng)域針對(duì)性的訓(xùn)練數(shù)據(jù),提高基于機(jī)器學(xué)習(xí)的信息抽取系統(tǒng)的準(zhǔn)確率,為實(shí)現(xiàn)情景化的調(diào)查訪談?shì)o助系統(tǒng)提供數(shù)據(jù)基礎(chǔ)。