一種分詞方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202010887529.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112069812A | 公開(公告)日 | 2020-12-11 |
申請(qǐng)公布號(hào) | CN112069812A | 申請(qǐng)公布日 | 2020-12-11 |
分類號(hào) | G06F40/284(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王哲;覃志奎;張炫;李波;曾少斌;胡俊;顏杰;劉鴻;未波波;楊鵬偉;鐘劍哲;喬柯巖;馮子劍;郭琳琳;趙向洋;李朋;張紅玉;蘇盈盈 | 申請(qǐng)(專利權(quán))人 | 喜大(上海)網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 北京品源專利代理有限公司 | 代理人 | 喜大(上海)網(wǎng)絡(luò)科技有限公司 |
地址 | 201203上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗(yàn)區(qū)丹桂路799號(hào)2幢2層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例公開了一種分詞方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)。該方法包括:劃分獲取的中文文本,得到以每個(gè)字符為起點(diǎn)并且可以成詞的候選切片集合;循環(huán)遍歷各所述候選切片集合,得到候選分詞結(jié)果;確定所述候選分詞結(jié)果中各候選切片長度的乘積值,并將乘積值最大的候選分詞結(jié)果作為所述中文文本的目標(biāo)分詞結(jié)果。上述方案選取分詞結(jié)果中長度乘積值最大的作為中文文本的目標(biāo)分詞結(jié)果,實(shí)現(xiàn)了分詞結(jié)果的全局最優(yōu),提高了分詞結(jié)果的準(zhǔn)確度。?? |
