一種用于輔助調(diào)查訪談的語(yǔ)料庫(kù)積累方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011089200.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112214586B | 公開(公告)日 | 2022-06-28 |
申請(qǐng)公布號(hào) | CN112214586B | 申請(qǐng)公布日 | 2022-06-28 |
分類號(hào) | G06F16/332(2019.01)I;G10L15/26(2006.01)I;G06N20/00(2019.01)I;G06F40/194(2020.01)I;G06F16/31(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 姚占雷;周謙豪;許鑫 | 申請(qǐng)(專利權(quán))人 | 華東師范大學(xué) |
代理機(jī)構(gòu) | 上海藍(lán)迪專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | - |
地址 | 200241上海市閔行區(qū)東川路500號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種用于輔助調(diào)查訪談的語(yǔ)料庫(kù)積累方法,其特點(diǎn)是采用領(lǐng)域語(yǔ)料向通用語(yǔ)料有條件轉(zhuǎn)化的積累機(jī)制的方法,將頻繁出現(xiàn)新的相似語(yǔ)料的領(lǐng)域語(yǔ)料轉(zhuǎn)化為通用語(yǔ)料,其情景化的語(yǔ)料庫(kù)積累具體包括:接收用戶輸入、通用語(yǔ)料的追加積累、領(lǐng)域情景語(yǔ)料的追加積累和領(lǐng)域語(yǔ)料向通用語(yǔ)料有條件轉(zhuǎn)化的積累等步驟。本發(fā)明與現(xiàn)有技術(shù)相比具領(lǐng)域語(yǔ)料庫(kù)和通用語(yǔ)料庫(kù)分離并存,進(jìn)一步明確領(lǐng)域?qū)S姓Z(yǔ)料的邊界,降低建立基于專家知識(shí)的規(guī)則的信息抽取系統(tǒng)的成本,有助于提供包含領(lǐng)域針對(duì)性的訓(xùn)練數(shù)據(jù),提高基于機(jī)器學(xué)習(xí)的信息抽取系統(tǒng)的準(zhǔn)確率,為實(shí)現(xiàn)情景化的調(diào)查訪談?shì)o助系統(tǒng)提供數(shù)據(jù)基礎(chǔ)。 |
