CN115880708A - App适老模式下文字段落间距合规性检测方法 - Google Patents

App适老模式下文字段落间距合规性检测方法 Download PDF

Info

Publication number
CN115880708A
CN115880708A CN202211691296.7A CN202211691296A CN115880708A CN 115880708 A CN115880708 A CN 115880708A CN 202211691296 A CN202211691296 A CN 202211691296A CN 115880708 A CN115880708 A CN 115880708A
Authority
CN
China
Prior art keywords
line
paragraph
coordinate
value
app
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211691296.7A
Other languages
English (en)
Inventor
周晟
高荣秀
卜佳俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202211691296.7A priority Critical patent/CN115880708A/zh
Publication of CN115880708A publication Critical patent/CN115880708A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

一种基于随机森林的移动应用适老模式下文字段落是否符合规定的检测方法,包括如下步骤:提出一种基于随机森林分类的文字段落检测方法,该方法确定一行文字是段落继续行数据,还是段落开始行数据;建立行间距、段间距合规检测模型,判断APP适老模式下文字大小及排版是否符合国标要求。本发明采用机器学习中较为稳定的随进森林算法,实现了非侵入式,即不用获取APP源码,普适性强,错误率低的一种移动应用适老模式下文字段落合规检测,可应用于复杂场景,且普适性强,可应用于移动应用的自动化测试等场景。

Description

APP适老模式下文字段落间距合规性检测方法
技术领域:
本发明涉及一种基于随机森林模型的APP适老模式下文字段落间距合规性检测方法,属于计算机技术软件领域。
背景技术:
针对已经完成适老化的改造的APP,需要检测其适老化改造是否符合要求。经过调研发现,老年人对主流App改造的最主要需求包括:大字体、大图标、大间距。因此APP在适老化过程中很重要的一点是检测文字段落间距是否能满足要求。
由于无法获取APP的源码,因此APP中出现的文字,只能通过在APP端截图,然后识别图像中文字的方式来获得。不同的文本情况,比如文本是一个段落继续行,还是段落开始行,有不同的间距判断方法,因此需要先把图片中的每一行进行分类,分类出是一个继续行,还是段落新开始的一行。
目前,常见的段落检测方法大多是基于规则的逻辑判断,通过是否缩进,上一行是否结束等来设计规则,判断是否是新的一段,该类方法主要存在以下缺陷:(1)段落格式繁多,基于规则的逻辑判断很难找到合适的规则;(2)方法切维护成本非常高,如果出现了新的段落格式,则需要重新考虑规则的逻辑;(3)无法应用于复杂场景,例如一段中出现了未考虑到的情况。(3)不具有普适性,例如新的排版格式下,当前的规则判断可能不会有很好的效果。
发明内容:
针对以上问题和难点,本发明提出了一种基于随机森林模型的APP适老模式下文字段落检测方法。与基于逻辑判断方法相比,该段落检测方法可适配多种情况,普适性更高,易于维护,且随机森林可以可视化出每个特征的重要程度,直观的感受每个特征的重要性,可解释性强。
段落检测完毕后,计算本上文字与上一行文字间距,根据一行文字是段落继续行数据,还是新的段落开始行数据,通过不同标准,判断间距合规与否。
综合以上两个步骤,一种APP适老模式下文字段落间距合规性检测方法的具体步骤如下:
S1:将开启适老模式的APP截图输入进光学字符识别(OCR)模块,识别图片中的所有文本行信息;
S2:对S1中获得的文本行信息进行特征工程,提取对应特征,作为原始特征;
S3:对S2收集的原始特征进行扩充,构建新的特征,加入到原始的特征中,丰富数据;
S4:将提取的行信息,标注为新的继续行数据,还是新的段落开始数据;
S5:利用S1到S4收集的数据离线训练随机森林算法,建立随机森林分类模型;
S6:输入新的一张带有文字的APP页面截图,根据随机森林模型,判断其中的每行文字为继续行数据,还是新的段落开始数据;
S7:根据行信息,计算出该行文字的字体大小;
S8:根据行信息,计算出该行与上一行的行间距;
S9:根据其是否是新的继续行数据,还是新的段落开始数据,通过行间距的大小,判断本行与上一行的间距是否满足国标对适老化APP的要求。
具体所述步骤S1中,其中所识别的文本行数据信息具体形式如下:每个文本行被一个矩形框定,矩形数据信息以列表形式存储,列表中的数据依次是左上角坐标值,右上角坐标值,右下角坐标值,左下角坐标值。其中,坐标系的原点在图片左上角,图片上边缘和左边缘分别为x轴、y轴,每个像素值为1单位,矩形四角坐标值在该坐标系下得出,坐标值中的第一个值为x轴值,第二个值为y轴值。
具体所述步骤S2中,其中构造特征方法如下:
S21:行高:本行左下角坐标的y值减去本行左上角坐标的y值;
S22:文本行左边缘到图片左边缘的距离:即本行左上角的x轴值;
S23:文本行右边缘到图片右边缘的距离:图片的宽度减去本行右上角x轴值;
S24:文本行中心坐标:(本行左上角的x坐标+本行右上角的x坐标)/2作为行中心的x坐标,(本行左上角的y坐标+本行左下角的y坐标)/2作为行中心的y坐标;
S25:文本行左边缘的缩进值:本行左边缘x坐标值减去最左边文本行的x坐标值;
S26:文本行右边缘的缩进值:最右边文本行的x坐标值减去本行右边缘坐标值;
S27:本行上边缘到上一行的上边缘的距离:本行的左上角y坐标减去上一行左上角y坐标;
S28:上一行宽度和最大行宽的比值:上一行右上角x坐标值减去上一行左上角x坐标值,获得上一行的宽度,上一行宽度除以最大行宽得到比值;
S29:行号:本行位于截图中所有文本行的第几行。
具体所述步骤S3中,其中构造的新特征包括:对S2中的每个特征计算其平均值、最大值、最小值、中值,作为新的特征加入到原始特征中。
具体所属步骤S4中,其中段落继续行数据和段落开始行数据分别具有如下特征:S41:段落开始行:通常段落开始行与上一行有强制性换行,语义上与上一行有较大差异;S42:段落继续行:通常段落继续行与上一行没有强制性的换行,语义上承接上一行。
具体所述步骤S5中,构造随机森林的具体方法为:S51:从原始训练集中使用Bootstraping方法随机有放回采样取出m个样本,共进行n次采样,生成n个训练集;S52:对于n个训练集,分别训练n个决策树模型;S53:对于单个决策树模型,每次***时根据基尼指数,选择特征进行***;S54:将生成的多颗决策树组成随机森林,按照多棵树分类器投票决定最终分类结果。
具体所述步骤S5中,随机森林判定的特征重要性依次为:上一行行宽度和最大行宽的比值、本行上边缘到上一行的上边缘的距离、文本行中心坐标的y坐标。
具体所述步骤S5中,随机森林的判断逻辑为:根据特征重要程度,随机森林的判断逻辑为:上一行行宽度和最大行宽的比值越大,本行上边缘到上一行的上边缘的距离越大,文本行中心坐标的y坐标越大,更容易判断为新开始段落行;反之,会容易被判断为继续段落行。
具体所述步骤S6中,其中判断其中的每行文字为继续行数据,还是新的段落开始数据的过程为:执行S1,S2,S3步骤,获取到新图片的特征值,将特征值输入进随进森林分类模型中,对每一行输出其为继续行数据,还是新的段落开始数据。
具体所述步骤S7中,利用到的行信息为:本行的左上角坐标,本行的左下角坐标。
具体所述步骤S7中,字体大小的计算方法为:本行左下角的坐标的y值-本行左上角的坐标的y值。
具体所述步骤S8中,利用到的行信息为:本行的左上角坐标,上一行的左上角坐标。
具体所述步骤S8中,行间距检测方案为:本行左上角坐标的y值,减去上一上左上角坐标的y值。
具体所述步骤S8中,其中行间距合规判断具体方案是:S81:如果是继续行数据,则行间距需要满足字体大小的1.3倍;S82:如果是新的段落开始数据,则段间距需要满足行间距的1.3倍;S83:若不满足上述条件,文字段落在APP适老模式下不合规。
综上,本发明创建了基于随机森林模型的APP适老模式下文字段落间距合规性检测,具有如下有益效果:(1)规则完善,利用大量数据学习到的规则,比单纯的逻辑规则可以覆盖更多的情况;(2)具有普适性,可应用于场景变化的情况。
附图说明:
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的段落继续行、段落开始行说明图;
图2是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的随机森林特征重要性可视化图;
图3是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的总体流程图;
图4是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的决策树流程图。
具体实施方法:
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本实例以某个开启适老化的APP截图为例,方法包括如下具体步骤:
S1:将开启适老模式的APP截图输入进光学字符识别(OCR)模块,识别图片中的所有文本行信息;
S2:对S1中获得的文本行信息进行特征工程,提取对应特征,作为原始特征;
S3:对S2收集的原始特征进行扩充,构建新的特征,加入到原始的特征中,丰富数据;
S4:将提取的行信息,标注为新的继续行数据,还是新的段落开始数据;
S5:利用S1到S4收集的数据离线训练随机森林算法,建立随机森林分类模型;
S6:输入新的一张带有文字的APP页面截图,根据随机森林模型,判断其中的每行文字为继续行数据,还是新的段落开始数据;
S7:根据行信息,计算出该行文字的字体大小;
S8:根据行信息,计算出该行与上一行的行间距;
S9:根据其是否是新的继续行数据,还是新的段落开始数据,通过行间距的大小,判断本行与上一行的间距是否满足国标对适老化APP的要求。
图1是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的段落继续行、段落开始行说明图:S501:图1标号0、1、2、6的文字具有新开始段落的特征,标号3、4、5、7、8、9则具有继续段落行特征。
图2是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的随机森林特征重要性可视化图。随机森林判定的前三个重要特征为:上一行行宽度和最大行宽的比值、本行上边缘到上一行的上边缘的距离、文本行中心坐标的y坐标。
图3是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的总体流程图。
图4是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的决策树流程图:S1:从原始训练集中使用Bootstraping方法随机有放回采样取出m个样本,共进行n次采样,生成n个训练集;S2:对于n个训练集,分别训练n个决策树模型;S3:对于单个决策树模型,每次***时根据基尼指数,选择特征进行***。

Claims (9)

1.一种APP适老模式下文字段落间距合规性检测方法,其特征在于,包括以下步骤:
S1:将开启适老模式的APP截图输入进光学字符识别(OCR)模块,识别图片中的所有文本行信息;
S2:对S1中获得的文本行信息进行特征工程,提取对应特征,作为原始特征;
S3:对S2收集的原始特征进行扩充,构建新的特征,加入到原始的特征中,丰富数据;
S4:将截图中的文本行,标注为段落继续行数据,还是段落开始数据;
S5:利用S1到S4收集的数据离线训练随机森林算法,建立随机森林分类模型;
S6:输入新的一张带有文字的APP页面截图,根据随机森林模型,判断其中的每行文字为段落继续行数据,还是段落开始行数据。
S7:根据行信息,计算出该行文字的字体大小;
S8:根据行信息,计算出该行与上一行的行间距;
S9:根据其是否是段落继续行数据,还是段落开始行数据,通过行间距的大小,判断本行与上一行的间距是否满足国标对适老化APP的要求。
2.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S1,其中所识别的文本行数据信息具体形式如下:
每个文本行被一个矩形框定,矩形数据信息以列表形式存储,列表中的数据依次是左上角坐标值,右上角坐标值,右下角坐标值,左下角坐标值。其中,坐标系的原点在图片左上角,图片上边缘和左边缘分别为x轴、y轴,每个像素值为1单位,矩形四角坐标值在该坐标系下得出,坐标值中的第一个值为x轴值,第二个值为y轴值。
3.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S2中,其中构造特征方法如下:
S21:行高:本行左下角坐标的y值减去本行左上角坐标的y值;
S22:文本行左边缘到图片左边缘的距离:即本行左上角的x轴值;
S23:文本行右边缘到图片右边缘的距离:图片的宽度减去本行右上角x轴值;
S24:文本行中心坐标:(本行左上角的x坐标+本行右上角的x坐标)/2作为行中心的x坐标,(本行左上角的y坐标+本行左下角的y坐标)/2作为行中心的y坐标;
S25:文本行左边缘的缩进值:本行左边缘x坐标值减去最左边文本行的x坐标值;
S26:文本行右边缘的缩进值:最右边文本行的x坐标值减去本行右边缘坐标值;
S27:本行上边缘到上一行的上边缘的距离:本行的左上角y坐标减去上一行左上角y坐标;
S28:上一行宽度和最大行宽的比值:上一行右上角x坐标值减去上一行左上角x坐标值,获得上一行的宽度,上一行宽度除以最大行宽得到比值;
S29:行号:本行位于截图中所有文本行的第几行。
4.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S3中,其中构造的新特征包括:
对S2中的每个特征计算其平均值、最大值、最小值、中值,作为新的特征加入到原始特征中。
5.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S4中,其中段落继续行数据和段落开始行分别具有如下特征:
S41:段落开始行:段落开始行与上一行有强制性换行,语义上与上一行有较大差异;
S42:段落继续行:段落继续行与上一行没有强制性的换行,语义上承接上一行。
6.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S5中,构造随机森林的具体方法为:
S51:从原始训练集中使用Bootstraping方法随机有放回采样取出m个样本,共进行n次采样,生成n个训练集;
S52:对于n个训练集,分别训练n个决策树模型;
S53:对于单个决策树模型,每次***时根据基尼指数,选择特征进行***;
S54:将生成的多棵决策树组成随机森林,按照多棵树分类器投票决定最终分类结果;
所述步骤S5中,随机森林判定的前三个重要特征为:上一行行宽度和最大行宽的比值、本行上边缘到上一行的上边缘的距离、文本行中心坐标的y坐标。
所述步骤S5中,随机森林的判断逻辑为:根据特征重要程度,随机森林的判断逻辑为:上一行行宽度和最大行宽的比值越大,本行上边缘到上一行的上边缘的距离越大,文本行中心坐标的y坐标越大,更容易判断为新开始段落行;反之,会容易被判断为继续段落行。
7.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S6中,其中判断其中的每行文字为继续行数据,还是新的段落开始数据的过程为:
执行S1,S2,S3步骤,获取到新图片的特征值,将特征值输入进随进森林分类模型中,对每一行输出其为继续行数据,还是新的段落开始数据。
根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S7中,利用到的行信息为:本行的左上角坐标,本行的左下角坐标。
所述步骤S7中,字体大小的计算方法为:本行左下角的坐标的y值-本行左上角的坐标的y值。
8.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S8中,利用到的行信息为:本行的左上角坐标,上一行的左上角坐标;
所述步骤S18中,行间距检测方案为:本行左上角坐标的y值,减去上一行左上角坐标的y值。
9.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S9中,行间距合规判断具体方案是:
S91:如果是继续行数据,则行间距需要满足字体大小的1.3倍;
S92:如果是新的段落开始数据,则段间距需要满足行间距的1.3倍;
S93:若不满足上述条件,文字段落在APP适老模式下不合规。
CN202211691296.7A 2022-12-27 2022-12-27 App适老模式下文字段落间距合规性检测方法 Pending CN115880708A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211691296.7A CN115880708A (zh) 2022-12-27 2022-12-27 App适老模式下文字段落间距合规性检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211691296.7A CN115880708A (zh) 2022-12-27 2022-12-27 App适老模式下文字段落间距合规性检测方法

Publications (1)

Publication Number Publication Date
CN115880708A true CN115880708A (zh) 2023-03-31

Family

ID=85754789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211691296.7A Pending CN115880708A (zh) 2022-12-27 2022-12-27 App适老模式下文字段落间距合规性检测方法

Country Status (1)

Country Link
CN (1) CN115880708A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578438A (zh) * 2023-07-13 2023-08-11 建信金融科技有限责任公司 一种适老化改造的自动化检测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578438A (zh) * 2023-07-13 2023-08-11 建信金融科技有限责任公司 一种适老化改造的自动化检测方法及装置
CN116578438B (zh) * 2023-07-13 2023-09-08 建信金融科技有限责任公司 一种适老化改造的自动化检测方法及装置

Similar Documents

Publication Publication Date Title
US7970213B1 (en) Method and system for improving the recognition of text in an image
CN113158808B (zh) 中文古籍字符识别、组段与版面重建方法、介质和设备
CN113139445A (zh) 表格识别方法、设备及计算机可读存储介质
US7796817B2 (en) Character recognition method, character recognition device, and computer product
CN110942074A (zh) 字符切分识别方法、装置、电子设备、存储介质
CN111291572A (zh) 一种文字排版方法、装置及计算机可读存储介质
WO2022089170A1 (zh) 字幕区域识别方法、装置、设备及存储介质
CN112069991A (zh) 一种pdf的表格信息提取方法及相关装置
CN113205047A (zh) 药名识别方法、装置、计算机设备和存储介质
CN115880708A (zh) App适老模式下文字段落间距合规性检测方法
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
CN116597466A (zh) 一种基于改进YOLOv5s的工程图纸文字检测识别方法及***
JP2012190434A (ja) 帳票定義装置、帳票定義方法、プログラム及び記録媒体
CN115019310B (zh) 图文识别方法及设备
CN115797939A (zh) 一种基于深度学习的两阶段斜体字符识别方法及装置
CN113095239B (zh) 一种关键帧提取方法、终端及计算机可读存储介质
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
CN111062377A (zh) 一种题号检测方法、***、存储介质及电子设备
CN110163203B (zh) 字符识别方法、装置、存储介质及计算机设备
CN117194818B (zh) 基于视频的图文网页生成方法及装置
CN116563869B (zh) 页面图像文字处理方法、装置、终端设备和可读存储介质
CN115984859B (zh) 一种图像文字识别的方法、装置及存储介质
JPH09274645A (ja) 文字認識方法および装置
CN115100672A (zh) 文字检测识别方法、装置、设备与计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination