一種語句歸類方法及裝置

基本信息

申請?zhí)?/td> CN201711448094.9 申請日 -
公開(公告)號(hào) CN108009157B 公開(公告)日 2021-04-27
申請公布號(hào) CN108009157B 申請公布日 2021-04-27
分類號(hào) G06F40/284;G06F16/35;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 胡文鳳;胡可云;陳聯(lián)忠 申請(專利權(quán))人 北京嘉和美康信息技術(shù)有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王寶筠
地址 100085 北京市海淀區(qū)上地信息產(chǎn)業(yè)基地開拓路7號(hào)1幢三層2307室
法律狀態(tài) -

摘要

摘要 本申請實(shí)施例公開了一種語句歸類方法,方法包括:獲取病歷文本,并對(duì)病歷文本中的語句進(jìn)行分割,得到若干個(gè)子句;對(duì)若干個(gè)子句進(jìn)行分詞,得到每一個(gè)子句的分詞結(jié)果;根據(jù)每一個(gè)子句的分詞結(jié)果以及屬性詞語概率表得到每一個(gè)子句屬于各個(gè)屬性的概率;基于每一個(gè)子句屬于各個(gè)屬性的概率確定每一個(gè)子句的待定屬性;若存在至少兩個(gè)相鄰的且待定屬性相同的子句,則將至少兩個(gè)相鄰的且待定屬性相同的子句歸為一類。這樣,可以將不同類別的子句分開提取,避免了在結(jié)構(gòu)化提取過程中會(huì)出現(xiàn)差錯(cuò),進(jìn)而提高了結(jié)構(gòu)化提取的準(zhǔn)確性,使得能夠?qū)σ痪湓捴械亩鄠€(gè)子句進(jìn)行準(zhǔn)確地結(jié)構(gòu)化提取。