一種基于文本的信息抽取方法和電子設(shè)備
基本信息
申請?zhí)?/td> | CN202010759112.0 | 申請日 | - |
公開(公告)號 | CN112000767A | 公開(公告)日 | 2020-11-27 |
申請公布號 | CN112000767A | 申請公布日 | 2020-11-27 |
分類號 | G06F16/33(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 楊志明 | 申請(專利權(quán))人 | 深思考人工智能科技(上海)有限公司 |
代理機構(gòu) | 北京德琦知識產(chǎn)權(quán)代理有限公司 | 代理人 | 深思考人工智能科技(上海)有限公司 |
地址 | 201210上海市浦東新區(qū)南匯新城鎮(zhèn)環(huán)湖西二路888號C樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種基于文本的信息抽取方法和電子設(shè)備,包括:對于文本中的每一行語句Li,對該行語句Li進(jìn)行糾錯處理后,確定糾錯后的語句與預(yù)設(shè)知識庫中每條信息的相似度,并根據(jù)所述相似度,確定該行語句Li對應(yīng)的所述信息的候選集合;根據(jù)所述候選集合中每條信息對應(yīng)的所述相似度以及與該行語句Li之間的長度差,按照相似度優(yōu)先的原則,確定所述候選集合中與該行語句Li相匹配的信息。應(yīng)用本申請公開的技術(shù)方案,能夠自動、準(zhǔn)確地從文本中提取出預(yù)設(shè)信息。?? |
