文本的特征的確定方法及裝置

基本信息

申請?zhí)?/td> CN202111153504.3 申請日 -
公開(公告)號 CN113868420A 公開(公告)日 2021-12-31
申請公布號 CN113868420A 申請公布日 2021-12-31
分類號 G06F16/35(2019.01)I;G06F16/31(2019.01)I;G06F40/30(2020.01)I;G06F40/247(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06Q30/02(2012.01)I 分類 計算;推算;計數(shù);
發(fā)明人 黃于晏;陳瑩瑩;李展鏗 申請(專利權(quán))人 有米科技股份有限公司
代理機構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 肖宇揚;江銀會
地址 510006廣東省廣州市番禺區(qū)小谷圍街青藍街26號1701
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文本的特征的確定方法及裝置,在確定出待識別行業(yè)的文本之后,通過先對待識別行業(yè)的文本執(zhí)行標(biāo)記操作,有利于提高執(zhí)行文本的哈希值確定操作的準(zhǔn)確性以及效率,再自動對確定出的文本的哈希值執(zhí)行映射操作,且不依賴于固定的詞表,能夠在保證保留所需文本的詞語的情況下降低文本的詞語數(shù)據(jù)量,從而有利于提高快速確定出準(zhǔn)確文本的特征向量,有利于提高識別出與文本匹配的行業(yè)類別的準(zhǔn)確性及效率。