一種語句歸類方法及裝置
基本信息
申請?zhí)?/td> | CN201711448094.9 | 申請日 | - |
公開(公告)號(hào) | CN108009157B | 公開(公告)日 | 2021-04-27 |
申請公布號(hào) | CN108009157B | 申請公布日 | 2021-04-27 |
分類號(hào) | G06F40/284;G06F16/35;G06K9/62 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 胡文鳳;胡可云;陳聯(lián)忠 | 申請(專利權(quán))人 | 北京嘉和美康信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王寶筠 |
地址 | 100085 北京市海淀區(qū)上地信息產(chǎn)業(yè)基地開拓路7號(hào)1幢三層2307室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請實(shí)施例公開了一種語句歸類方法,方法包括:獲取病歷文本,并對(duì)病歷文本中的語句進(jìn)行分割,得到若干個(gè)子句;對(duì)若干個(gè)子句進(jìn)行分詞,得到每一個(gè)子句的分詞結(jié)果;根據(jù)每一個(gè)子句的分詞結(jié)果以及屬性詞語概率表得到每一個(gè)子句屬于各個(gè)屬性的概率;基于每一個(gè)子句屬于各個(gè)屬性的概率確定每一個(gè)子句的待定屬性;若存在至少兩個(gè)相鄰的且待定屬性相同的子句,則將至少兩個(gè)相鄰的且待定屬性相同的子句歸為一類。這樣,可以將不同類別的子句分開提取,避免了在結(jié)構(gòu)化提取過程中會(huì)出現(xiàn)差錯(cuò),進(jìn)而提高了結(jié)構(gòu)化提取的準(zhǔn)確性,使得能夠?qū)σ痪湓捴械亩鄠€(gè)子句進(jìn)行準(zhǔn)確地結(jié)構(gòu)化提取。 |
