知識組塊提取方法、裝置、電子設(shè)備和存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110859647.X | 申請日 | - |
公開(公告)號 | CN113298914B | 公開(公告)日 | 2021-10-15 |
申請公布號 | CN113298914B | 申請公布日 | 2021-10-15 |
分類號 | G06T11/60(2006.01)I;G06F40/166(2020.01)I;G06F40/295(2020.01)I;G06N3/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 曹夢娣;劉俊辰;陳奇寧 | 申請(專利權(quán))人 | 北京明略軟件系統(tǒng)有限公司 |
代理機構(gòu) | 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 | 代理人 | 蔡良偉;張娜 |
地址 | 100084北京市海淀區(qū)中關(guān)村東路1號院1號樓10層A1002 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種知識組塊提取方法、裝置、電子設(shè)備和存儲介質(zhì)。其中,方法包括獲取PPTX文檔中每頁幻燈片的文本信息;其中,所述文本信息包括幻燈片中文本框中的文字內(nèi)容、文本框的位置和文本框中字體大??;根據(jù)所述文本信息,確定每頁幻燈片的知識類別;基于所述知識類別,對每頁幻燈片進行要素抽取,獲取每頁幻燈片的知識組塊。采用本發(fā)明提供的方案能利用PPTX文檔中的字體格式等信息提取文檔中的知識組塊,提取更準確。 |
