一種無意義句子識別的方法和設(shè)備

基本信息

申請?zhí)?/td> CN201710255837.4 申請日 -
公開(公告)號 CN107066447B 公開(公告)日 2021-03-26
申請公布號 CN107066447B 申請公布日 2021-03-26
分類號 G06F40/211(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 姚佳 申請(專利權(quán))人 廣東惠禾科技發(fā)展有限公司
代理機(jī)構(gòu) 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 馬維麗
地址 518054廣東省深圳市南山區(qū)粵海街道學(xué)府路2388號怡化金融科技大廈14樓01-02單元
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種無意義句子識別的方法和設(shè)備,其中該方法包括:獲取數(shù)量超過指定數(shù)量的預(yù)先確定了有無意義的標(biāo)本句子;通過對所述標(biāo)本句子進(jìn)行特征抽取,獲取到基于分詞和詞性處理得到的特征的概率特征值、以及獲取到各類型字詞以及標(biāo)點的字?jǐn)?shù)及字詞比例;將所述概率特征值、所述字?jǐn)?shù)以及所述字詞比例在邏輯斯特回歸模型中訓(xùn)練,得到無意義句子識別模型;當(dāng)接收到待判斷的新句子時,對所述新句子進(jìn)行特征抽取,并基于所獲取到的特征和所述無意義句子識別模型確定所述新句子是否為無意義句子。以此實現(xiàn)了對無意義句子的識別,且還通過標(biāo)點的字?jǐn)?shù)及字詞比例來進(jìn)行訓(xùn)練,實現(xiàn)了不同場景下對無意義句子的不同標(biāo)準(zhǔn)的識別。??