從表格中提取公式的方法、電子設(shè)備和計算機可讀介質(zhì)

基本信息

申請?zhí)?/td> CN202010273996.9 申請日 -
公開(公告)號 CN113515920A 公開(公告)日 2021-10-19
申請公布號 CN113515920A 申請公布日 2021-10-19
分類號 G06F40/166(2020.01)I;G06F40/226(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 林得苗 申請(專利權(quán))人 北京庖丁科技有限公司
代理機構(gòu) 北京唯智勤實知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 陳佳
地址 100091北京市海淀區(qū)廂黃旗2號樓2層X06-205室
法律狀態(tài) -

摘要

摘要 本公開的實施例公開了從表格中提取公式的方法、電子設(shè)備和計算機可讀介質(zhì)。該方法的一具體實施方式包括:獲取表格,抽取該表格中每個單元格的單元格內(nèi)容,得到單元格內(nèi)容集合,基于單元格內(nèi)容集合,生成表格中的初始關(guān)系信息,基于單元格內(nèi)容集合和初始關(guān)系信息,生成初始有向無環(huán)圖,將表格輸入預(yù)先訓(xùn)練的特征提取模型,得到表格特征向量,基于表格特征向量和初始有向無環(huán)圖,生成有向無環(huán)圖,基于有向無環(huán)圖,生成表格中的公式。這種方法不需要人工預(yù)先設(shè)定規(guī)則和公式模板,能夠自動提取表格中的公式,適用于不同表格類型,泛化能力強,方便用戶發(fā)現(xiàn)表格中公式計算錯誤。