一種分詞方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010887529.5 申請(qǐng)日 -
公開(公告)號(hào) CN112069812A 公開(公告)日 2020-12-11
申請(qǐng)公布號(hào) CN112069812A 申請(qǐng)公布日 2020-12-11
分類號(hào) G06F40/284(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王哲;覃志奎;張炫;李波;曾少斌;胡俊;顏杰;劉鴻;未波波;楊鵬偉;鐘劍哲;喬柯巖;馮子劍;郭琳琳;趙向洋;李朋;張紅玉;蘇盈盈 申請(qǐng)(專利權(quán))人 喜大(上海)網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 北京品源專利代理有限公司 代理人 喜大(上海)網(wǎng)絡(luò)科技有限公司
地址 201203上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗(yàn)區(qū)丹桂路799號(hào)2幢2層
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開了一種分詞方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)。該方法包括:劃分獲取的中文文本,得到以每個(gè)字符為起點(diǎn)并且可以成詞的候選切片集合;循環(huán)遍歷各所述候選切片集合,得到候選分詞結(jié)果;確定所述候選分詞結(jié)果中各候選切片長度的乘積值,并將乘積值最大的候選分詞結(jié)果作為所述中文文本的目標(biāo)分詞結(jié)果。上述方案選取分詞結(jié)果中長度乘積值最大的作為中文文本的目標(biāo)分詞結(jié)果,實(shí)現(xiàn)了分詞結(jié)果的全局最優(yōu),提高了分詞結(jié)果的準(zhǔn)確度。??