一種現(xiàn)實(shí)場景下的閱讀綜合行為的識別方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202010499715.1 | 申請日 | - |
公開(公告)號 | CN111860122A | 公開(公告)日 | 2020-10-30 |
申請公布號 | CN111860122A | 申請公布日 | 2020-10-30 |
分類號 | G06K9/00(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 范驍駿;高旻昱 | 申請(專利權(quán))人 | 上海翎騰智能科技有限公司 |
代理機(jī)構(gòu) | 上海漢聲知識產(chǎn)權(quán)代理有限公司 | 代理人 | 上海翎騰智能科技有限公司 |
地址 | 201203上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗(yàn)區(qū)芳春路400號1幢3層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及閱讀綜合行為識別的技術(shù)領(lǐng)域,提供了一種現(xiàn)實(shí)場景下的閱讀綜合行為的識別方法及系統(tǒng),其方法包括:S1:獲取真實(shí)閱讀場景下的信息載體圖像;S2:對信息載體圖像進(jìn)行定位和邊緣位置檢測,對書本內(nèi)部的圖像內(nèi)容進(jìn)行檢測,實(shí)現(xiàn)對翻頁行為的識別;S3:針對頁面范圍內(nèi)的信息進(jìn)行隨機(jī)采樣,對候選焦點(diǎn)語言特征點(diǎn)圖片組進(jìn)行綜合分析,實(shí)現(xiàn)對焦點(diǎn)頁面語言的識別;S4:對行的信息進(jìn)行定位,獲得行數(shù)和每一行的行寬,估算出每一行的文字?jǐn)?shù)量和頁面內(nèi)的文字總數(shù)量;S5:獲取兩次翻頁事件之間的時(shí)間間隔內(nèi)閱讀文字的總數(shù)量,計(jì)算出單位時(shí)間內(nèi)的閱讀文字總量。能夠?qū)ψx者的閱讀行為,尤其是針對于閱讀紙質(zhì)書本的閱讀行為進(jìn)行實(shí)時(shí)的分析。?? |
