CN115880708A

CN115880708A - App适老模式下文字段落间距合规性检测方法

Info

Publication number: CN115880708A
Application number: CN202211691296.7A
Authority: CN
Inventors: 周晟; 高荣秀; 卜佳俊
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-12-27
Filing date: 2022-12-27
Publication date: 2023-03-31

Abstract

一种基于随机森林的移动应用适老模式下文字段落是否符合规定的检测方法，包括如下步骤：提出一种基于随机森林分类的文字段落检测方法，该方法确定一行文字是段落继续行数据，还是段落开始行数据；建立行间距、段间距合规检测模型，判断APP适老模式下文字大小及排版是否符合国标要求。本发明采用机器学习中较为稳定的随进森林算法，实现了非侵入式，即不用获取APP源码，普适性强，错误率低的一种移动应用适老模式下文字段落合规检测，可应用于复杂场景，且普适性强，可应用于移动应用的自动化测试等场景。

Description

APP适老模式下文字段落间距合规性检测方法

技术领域：

本发明涉及一种基于随机森林模型的APP适老模式下文字段落间距合规性检测方法，属于计算机技术软件领域。

背景技术：

针对已经完成适老化的改造的APP，需要检测其适老化改造是否符合要求。经过调研发现，老年人对主流App改造的最主要需求包括：大字体、大图标、大间距。因此APP在适老化过程中很重要的一点是检测文字段落间距是否能满足要求。

由于无法获取APP的源码，因此APP中出现的文字，只能通过在APP端截图，然后识别图像中文字的方式来获得。不同的文本情况，比如文本是一个段落继续行，还是段落开始行，有不同的间距判断方法，因此需要先把图片中的每一行进行分类，分类出是一个继续行，还是段落新开始的一行。

目前，常见的段落检测方法大多是基于规则的逻辑判断，通过是否缩进，上一行是否结束等来设计规则，判断是否是新的一段，该类方法主要存在以下缺陷：(1)段落格式繁多，基于规则的逻辑判断很难找到合适的规则；(2)方法切维护成本非常高，如果出现了新的段落格式，则需要重新考虑规则的逻辑；(3)无法应用于复杂场景，例如一段中出现了未考虑到的情况。(3)不具有普适性，例如新的排版格式下，当前的规则判断可能不会有很好的效果。

发明内容：

针对以上问题和难点，本发明提出了一种基于随机森林模型的APP适老模式下文字段落检测方法。与基于逻辑判断方法相比，该段落检测方法可适配多种情况，普适性更高，易于维护，且随机森林可以可视化出每个特征的重要程度，直观的感受每个特征的重要性，可解释性强。

段落检测完毕后，计算本上文字与上一行文字间距，根据一行文字是段落继续行数据，还是新的段落开始行数据，通过不同标准，判断间距合规与否。

综合以上两个步骤，一种APP适老模式下文字段落间距合规性检测方法的具体步骤如下：

S1：将开启适老模式的APP截图输入进光学字符识别(OCR)模块，识别图片中的所有文本行信息；

S2：对S1中获得的文本行信息进行特征工程，提取对应特征，作为原始特征；

S3：对S2收集的原始特征进行扩充，构建新的特征，加入到原始的特征中，丰富数据；

S4：将提取的行信息，标注为新的继续行数据，还是新的段落开始数据；

S5：利用S1到S4收集的数据离线训练随机森林算法，建立随机森林分类模型；

S6:输入新的一张带有文字的APP页面截图，根据随机森林模型，判断其中的每行文字为继续行数据，还是新的段落开始数据；

S7:根据行信息，计算出该行文字的字体大小；

S8：根据行信息，计算出该行与上一行的行间距；

S9:根据其是否是新的继续行数据，还是新的段落开始数据，通过行间距的大小，判断本行与上一行的间距是否满足国标对适老化APP的要求。

具体所述步骤S1中，其中所识别的文本行数据信息具体形式如下：每个文本行被一个矩形框定，矩形数据信息以列表形式存储，列表中的数据依次是左上角坐标值，右上角坐标值，右下角坐标值，左下角坐标值。其中，坐标系的原点在图片左上角，图片上边缘和左边缘分别为x轴、y轴，每个像素值为1单位，矩形四角坐标值在该坐标系下得出，坐标值中的第一个值为x轴值，第二个值为y轴值。

具体所述步骤S2中，其中构造特征方法如下：

S21:行高：本行左下角坐标的y值减去本行左上角坐标的y值；

S22:文本行左边缘到图片左边缘的距离：即本行左上角的x轴值；

S23:文本行右边缘到图片右边缘的距离：图片的宽度减去本行右上角x轴值；

S24:文本行中心坐标：(本行左上角的x坐标+本行右上角的x坐标)/2作为行中心的x坐标，(本行左上角的y坐标+本行左下角的y坐标)/2作为行中心的y坐标；

S25:文本行左边缘的缩进值：本行左边缘x坐标值减去最左边文本行的x坐标值；

S26:文本行右边缘的缩进值：最右边文本行的x坐标值减去本行右边缘坐标值；

S27:本行上边缘到上一行的上边缘的距离：本行的左上角y坐标减去上一行左上角y坐标；

S28:上一行宽度和最大行宽的比值：上一行右上角x坐标值减去上一行左上角x坐标值，获得上一行的宽度，上一行宽度除以最大行宽得到比值；

S29:行号：本行位于截图中所有文本行的第几行。

具体所述步骤S3中，其中构造的新特征包括：对S2中的每个特征计算其平均值、最大值、最小值、中值，作为新的特征加入到原始特征中。

具体所属步骤S4中，其中段落继续行数据和段落开始行数据分别具有如下特征：S41：段落开始行：通常段落开始行与上一行有强制性换行，语义上与上一行有较大差异；S42:段落继续行：通常段落继续行与上一行没有强制性的换行，语义上承接上一行。

具体所述步骤S5中，构造随机森林的具体方法为：S51:从原始训练集中使用Bootstraping方法随机有放回采样取出m个样本，共进行n次采样，生成n个训练集；S52:对于n个训练集，分别训练n个决策树模型；S53:对于单个决策树模型，每次***时根据基尼指数，选择特征进行***；S54:将生成的多颗决策树组成随机森林，按照多棵树分类器投票决定最终分类结果。

具体所述步骤S5中，随机森林判定的特征重要性依次为：上一行行宽度和最大行宽的比值、本行上边缘到上一行的上边缘的距离、文本行中心坐标的y坐标。

具体所述步骤S5中，随机森林的判断逻辑为：根据特征重要程度，随机森林的判断逻辑为：上一行行宽度和最大行宽的比值越大，本行上边缘到上一行的上边缘的距离越大，文本行中心坐标的y坐标越大，更容易判断为新开始段落行；反之，会容易被判断为继续段落行。

具体所述步骤S6中，其中判断其中的每行文字为继续行数据，还是新的段落开始数据的过程为：执行S1，S2，S3步骤，获取到新图片的特征值，将特征值输入进随进森林分类模型中，对每一行输出其为继续行数据，还是新的段落开始数据。

具体所述步骤S7中，利用到的行信息为：本行的左上角坐标，本行的左下角坐标。

具体所述步骤S7中，字体大小的计算方法为：本行左下角的坐标的y值-本行左上角的坐标的y值。

具体所述步骤S8中，利用到的行信息为：本行的左上角坐标，上一行的左上角坐标。

具体所述步骤S8中，行间距检测方案为：本行左上角坐标的y值，减去上一上左上角坐标的y值。

具体所述步骤S8中，其中行间距合规判断具体方案是：S81:如果是继续行数据，则行间距需要满足字体大小的1.3倍；S82:如果是新的段落开始数据，则段间距需要满足行间距的1.3倍；S83:若不满足上述条件，文字段落在APP适老模式下不合规。

综上，本发明创建了基于随机森林模型的APP适老模式下文字段落间距合规性检测，具有如下有益效果：(1)规则完善，利用大量数据学习到的规则，比单纯的逻辑规则可以覆盖更多的情况；(2)具有普适性，可应用于场景变化的情况。

附图说明：

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的段落继续行、段落开始行说明图；

图2是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的随机森林特征重要性可视化图；

图3是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的总体流程图；

图4是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的决策树流程图。

具体实施方法：

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本实例以某个开启适老化的APP截图为例，方法包括如下具体步骤：

S7:根据行信息，计算出该行文字的字体大小；

S8：根据行信息，计算出该行与上一行的行间距；

图1是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的段落继续行、段落开始行说明图：S501:图1标号0、1、2、6的文字具有新开始段落的特征，标号3、4、5、7、8、9则具有继续段落行特征。

图2是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的随机森林特征重要性可视化图。随机森林判定的前三个重要特征为：上一行行宽度和最大行宽的比值、本行上边缘到上一行的上边缘的距离、文本行中心坐标的y坐标。

图3是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的总体流程图。

图4是是本发明提供的基于随机森林模型的APP适老模式下文字段落间距合规性检测方法的决策树流程图：S1:从原始训练集中使用Bootstraping方法随机有放回采样取出m个样本，共进行n次采样，生成n个训练集；S2:对于n个训练集，分别训练n个决策树模型；S3:对于单个决策树模型，每次***时根据基尼指数，选择特征进行***。

Claims

1.一种APP适老模式下文字段落间距合规性检测方法，其特征在于，包括以下步骤：

S4：将截图中的文本行，标注为段落继续行数据，还是段落开始数据；

S6:输入新的一张带有文字的APP页面截图，根据随机森林模型，判断其中的每行文字为段落继续行数据，还是段落开始行数据。

S7:根据行信息，计算出该行文字的字体大小；

S8：根据行信息，计算出该行与上一行的行间距；

S9:根据其是否是段落继续行数据，还是段落开始行数据，通过行间距的大小，判断本行与上一行的间距是否满足国标对适老化APP的要求。

2.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S1，其中所识别的文本行数据信息具体形式如下：

每个文本行被一个矩形框定，矩形数据信息以列表形式存储，列表中的数据依次是左上角坐标值，右上角坐标值，右下角坐标值，左下角坐标值。其中，坐标系的原点在图片左上角，图片上边缘和左边缘分别为x轴、y轴，每个像素值为1单位，矩形四角坐标值在该坐标系下得出，坐标值中的第一个值为x轴值，第二个值为y轴值。

3.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S2中，其中构造特征方法如下：

S21:行高：本行左下角坐标的y值减去本行左上角坐标的y值；

S29:行号：本行位于截图中所有文本行的第几行。

4.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S3中，其中构造的新特征包括：

对S2中的每个特征计算其平均值、最大值、最小值、中值，作为新的特征加入到原始特征中。

5.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S4中，其中段落继续行数据和段落开始行分别具有如下特征：

S41：段落开始行：段落开始行与上一行有强制性换行，语义上与上一行有较大差异；

S42:段落继续行：段落继续行与上一行没有强制性的换行，语义上承接上一行。

6.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S5中，构造随机森林的具体方法为：

S51:从原始训练集中使用Bootstraping方法随机有放回采样取出m个样本，共进行n次采样，生成n个训练集；

S52:对于n个训练集，分别训练n个决策树模型；

S53:对于单个决策树模型，每次***时根据基尼指数，选择特征进行***；

S54:将生成的多棵决策树组成随机森林，按照多棵树分类器投票决定最终分类结果；

所述步骤S5中，随机森林判定的前三个重要特征为：上一行行宽度和最大行宽的比值、本行上边缘到上一行的上边缘的距离、文本行中心坐标的y坐标。

所述步骤S5中，随机森林的判断逻辑为：根据特征重要程度，随机森林的判断逻辑为：上一行行宽度和最大行宽的比值越大，本行上边缘到上一行的上边缘的距离越大，文本行中心坐标的y坐标越大，更容易判断为新开始段落行；反之，会容易被判断为继续段落行。

7.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S6中，其中判断其中的每行文字为继续行数据，还是新的段落开始数据的过程为：

执行S1，S2，S3步骤，获取到新图片的特征值，将特征值输入进随进森林分类模型中，对每一行输出其为继续行数据，还是新的段落开始数据。

根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S7中，利用到的行信息为：本行的左上角坐标，本行的左下角坐标。

所述步骤S7中，字体大小的计算方法为：本行左下角的坐标的y值-本行左上角的坐标的y值。

8.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S8中，利用到的行信息为：本行的左上角坐标，上一行的左上角坐标；

所述步骤S18中，行间距检测方案为：本行左上角坐标的y值，减去上一行左上角坐标的y值。

9.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法，其特征在于：所述步骤S9中，行间距合规判断具体方案是：

S91:如果是继续行数据，则行间距需要满足字体大小的1.3倍；

S92:如果是新的段落开始数据，则段间距需要满足行间距的1.3倍；

S93:若不满足上述条件，文字段落在APP适老模式下不合规。