一種批量生成語(yǔ)料的方法和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201810803666.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN109388717B | 公開(kāi)(公告)日 | 2021-04-20 |
申請(qǐng)公布號(hào) | CN109388717B | 申請(qǐng)公布日 | 2021-04-20 |
分類(lèi)號(hào) | G06F16/36 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 胡云華;鄭俊成;莫瑜;孔委;高鵬 | 申請(qǐng)(專(zhuān)利權(quán))人 | 智能一點(diǎn)(無(wú)錫)科技有限公司 |
代理機(jī)構(gòu) | 北京科龍寰宇知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 孫皓晨;侯奇慧 |
地址 | 310051 浙江省杭州市濱江區(qū)江南大道588號(hào)恒鑫大廈主樓15層 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種批量生成語(yǔ)料的方法和系統(tǒng),該方法包括以下步驟:S1:設(shè)置語(yǔ)料應(yīng)用的場(chǎng)景;S2:為場(chǎng)景設(shè)置一意圖庫(kù),意圖庫(kù)中包含與該場(chǎng)景對(duì)應(yīng)的至少一個(gè)意圖;S3:設(shè)置一情境庫(kù)和一句式庫(kù),情境庫(kù)中包含至少一個(gè)情境,句式庫(kù)包含至少一個(gè)句式,為每一情境分別設(shè)置至少一個(gè)與之對(duì)應(yīng)的句式;S4:為每一意圖選擇至少一個(gè)與之對(duì)應(yīng)的情境;S5:根據(jù)句式所屬的場(chǎng)景、意圖和情境,分別為每一情境下的每一句式設(shè)置生成完整句式所需的多個(gè)詞組;S6:將多個(gè)詞組應(yīng)用至與之對(duì)應(yīng)的句式中,得到一初選語(yǔ)料庫(kù);S7:對(duì)初選語(yǔ)料庫(kù)進(jìn)行篩選,選出其中高質(zhì)量的語(yǔ)料。本發(fā)明生成的語(yǔ)料數(shù)據(jù)豐富、完整并且場(chǎng)景復(fù)用性好,能夠節(jié)省大量的人力和時(shí)間,具有很強(qiáng)的實(shí)用性。 |
