一種批量生成語料的方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201810803666.9 | 申請日 | - |
公開(公告)號 | CN109388717A | 公開(公告)日 | 2021-04-20 |
申請公布號 | CN109388717A | 申請公布日 | 2021-04-20 |
分類號 | G06F16/36 | 分類 | 計算;推算;計數; |
發(fā)明人 | 胡云華;鄭俊成;莫瑜;孔委;高鵬 | 申請(專利權)人 | 智能一點(無錫)科技有限公司 |
代理機構 | 北京科龍寰宇知識產權代理有限責任公司 | 代理人 | 孫皓晨;侯奇慧 |
地址 | 100084 北京市海淀區(qū)中關村SOHOB709 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種批量生成語料的方法和系統(tǒng),該方法包括以下步驟:S1:設置語料應用的場景;S2:為場景設置一意圖庫,意圖庫中包含與該場景對應的至少一個意圖;S3:設置一情境庫和一句式庫,情境庫中包含至少一個情境,句式庫包含至少一個句式,為每一情境分別設置至少一個與之對應的句式;S4:為每一意圖選擇至少一個與之對應的情境;S5:根據句式所屬的場景、意圖和情境,分別為每一情境下的每一句式設置生成完整句式所需的多個詞組;S6:將多個詞組應用至與之對應的句式中,得到一初選語料庫;S7:對初選語料庫進行篩選,選出其中高質量的語料。本發(fā)明生成的語料數據豐富、完整并且場景復用性好,能夠節(jié)省大量的人力和時間,具有很強的實用性。 |
