一種基于深度學習的簡歷解析方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202010728915.X 申請日 -
公開(公告)號 CN111737969A 公開(公告)日 2020-10-02
申請公布號 CN111737969A 申請公布日 2020-10-02
分類號 G06F40/205(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 安永進;魯林;唐曉陽;閆慧強 申請(專利權(quán))人 北森云計算有限公司
代理機構(gòu) 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 代理人 北森云計算有限公司
地址 610041四川省成都市高新區(qū)萃華路89號1棟1單元4001號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及電數(shù)字數(shù)據(jù)處理技術(shù)領(lǐng)域,本發(fā)明公開了一種基于深度學習的簡歷解析方法和系統(tǒng),該簡歷解析方法包括富文本提取、文本清洗、文本排序、語句切分、語句分類、區(qū)塊識別、條目劃分和區(qū)塊內(nèi)字段值提取步驟,并在此過程中結(jié)合NLP、OCR和命名實體識別等技術(shù)對簡歷特征進行建模和規(guī)?;哪P陀柧殹1景l(fā)明從文本提取階段,就把樣式、位置等信息作為和文本同等重要的信息一并提取返回,并在后續(xù)分句、區(qū)塊和條目識別、類別映射等階段融入樣式信息,達到讓解析器像人一樣重點突出地閱讀簡歷的目的,從而提升整體解析效果。??