CN110689447A

CN110689447A - 一种基于深度学习的社交软件用户发布内容的实时检测方法

Info

Publication number: CN110689447A
Application number: CN201910817334.0A
Authority: CN
Inventors: 殷磊; 胡庆浩; 程健
Original assignee: Nanjing Artificial Intelligence Chip Innovation Institute Institute Of Automation Chinese Academy Of Sciences
Current assignee: Nanjing Artificial Intelligence Chip Innovation Institute Institute Of Automation Chinese Academy Of Sciences
Priority date: 2019-08-30
Filing date: 2019-08-30
Publication date: 2020-01-14

Abstract

本发明一种基于深度学习的社交软件用户发布内容的实时检测方法，属于深度学习和图像处理技术领域。所述方法包括：进行模板标注，生成标注模板信息；利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类，生成带类别的文字区域信息；根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配，生成结构化信息数据。

Description

一种基于深度学习的社交软件用户发布内容的实时检测方法

技术领域

本发明属于社交软件发布内容检测领域，具体涉及一种基于深度学习的社交软件用户发布内容的实时检测***。

背景技术

随着移动互联网的快速发展，越来越多的人使用社交软件来分享他们的生活，社交软件的用户正在呈指数上升，同时用户人群不分年龄段，青少年一直是使用社交软件的主力军。在社交软件发展的过程中，不时地会出现色情，暴力，血腥等低俗内容（文字，图像，视频等），这严重阻碍了社交软件的发展，也同时给社会带了极其恶劣的影响，尤其是对心智尚未成熟的青少年极为严重的迫害。提高社交软件的监管审查力度也越来越迫切。但是，随着用户人群不断增多，发布内容激增，依靠人力一条一条地甄别这些内容显得极其不实际。因此，社交软件急需一款内置的检测工具，利用AI在用户按下发布按钮之后对用户所发布的内容进行实时且快速的评价，只有经鉴定合格之后才能发布到社交平台之上。

传统的文字，图像检测方法存在精度低速度慢等特点。随着深度学习的发展，越来越多的实际问题如文本检测，目标检测都开始使用深度学习技术，其识别精度比传统方法有了质的飞越，同时在速度上也有了较大的提升，因此，这用于社交软件之上也并不会让用户感受到明显的等待时间，不会影响到用户体验。目前，针对社交软件中的不良低俗内容，大多数社交软件依然是依靠用户举报继而人力甄别，网络管理员巡查等手段为主，文字、图像在线算法自动检测为辅来实现的，这就存在很多问题：

（1）传统的检测方法精度过低，容易造成漏检等现象。同时，传统检测方法速度过慢，影响用户的主观体验。

（2）依靠人力的检测已经完全应付不了呈指数增长的发布内容，对于社交软件来说，也相应地增加了成本。

（3）人力的监管也无法做到24小时不间断的工作，疲劳以及长时间重复的工作这种种因素也会导致人力检测精度的降低。

为了解决以上问题，本专利提出了一种基于深度学习的社交软件发布内容的实时检测方法和***，该工具能实时且快速地在用户按下发布按钮之前，自动检测且评定用户即将发布的内容是否包含不良或低俗的内容，只有评定合格之后才准予发布，从而实现了自动检测为主，人力审查为辅的监管模式。

发明内容

针对现有技术上存在的不足，本发明提供一种基于深度学习的社交软件用户发布内容的实时检测***。针对文本，图像，视频等内容，利用基于深度学习的检测方法，进行实时评定，如若判定不合格则不允许发布。基于深度学习的文本，图像实时检测评定技术，即利用训练好的深度学习模型对社交软件用户即将发布的内容（文本，图像，视频）进行实时分类，如若判定模型的输入为不良或低速的内容，则不允许发布。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，提供了一种基于深度学习的社交软件用户发布内容的实时监测方法所述方法包括：进行模板标注，生成标注模板信息；利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类，生成带类别的文字区域信息；根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配，生成结构化信息数据。

结合第一方面，在第一种可能的实现方式中，进行模板标注，生成标注模板信息，包括：标注模板锚点和非锚点文字区域的大小及相对位置，以及实体与所述锚点、非锚点文字区域的映射关系，生成标注模板信息。

结合第一方面，在第二种可能的实现方式中，利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类，生成带类别的文字区域信息，包括：利用预设深度神经网络检测模型检测待检测图像的文字行，通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。

结合第一方面，在第三种可能的实现方式中，根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配，生成结构化信息数据，包括：将所述标注模板信息与所述带类别的文字区域信息作为输出，匹配定位锚点，并通过锚点将所述带类别的文字区域映射到对应的实体，去除包括非文本区域和无关文本在内的冗余部分，生成结构化信息。

结合第一方面方式中，所述方法还包括：对输入的待检测图像进行图像预处理，所述图像预处理包括图像矫正和/或缩放到统一尺寸。

结合第一方面方式中，所述方法还包括：训练获得所述预设深度神经网络检测模型。

结合第一方面方式中，训练获得所述预设深度神经网络检测模型，包括：使用样本生成工具生成样本；使用样本进行训练；获得初步深度神经网络检测模型；在检测应用中形成数据回流，获得更多的新样本；用新样本在初步深度神经网络检测模型上进行Fine-tuning。

第二方面，提供了一种基于深度神经网络的文本检测分析装置，包括：标注模块，用于进行模板标注，生成标注模板信息；文字区域检测模块，用于利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类，生成带类别的文字区域信息；匹配模块，用于根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配，生成结构化信息数据。

结合第二方面，在第一种可能的实现方式中，所述标注模块用于：标注模板锚点和非锚点文字区域的大小及相对位置，以及实体与所述锚点、非锚点文字区域的映射关系，生成标注模板信息。

结合第二方面，在第二种可能的实现方式中，所述文字区域检测模块用于：利用预设深度神经网络检测模型检测待检测图像的文字行，通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。

结合第二方面，在第三种可能的实现方式中，所述匹配模块用于：将所述标注模板信息与所述带类别的文字区域信息作为输出，匹配定位锚点，并通过锚点将所述带类别的文字区域映射到对应的实体，去除包括非文本区域和无关文本在内的冗余部分，生成结构化信息。

结合第二方面及第二方面的第一至三任一种可能方式，所述装置还包括图像预处理模块，用于对输入的待检测图像进行图像预处理，所述图像预处理包括图像矫正和/或缩放到统一尺寸。

结合第二方面及第二方面的第一至三任一种可能方式，所述装置还包括模型训练模块，用于训练获得所述预设深度神经网络检测模型。

结合第二方面方式，所述模型训练模块用于：使用样本生成工具生成样本；使用样本进行训练；获得初步深度神经网络检测模型；在检测应用中形成数据回流，获得更多的新样本；用新样本在初步深度神经网络检测模型上进行Fine-tuning。

本发明具有以下优点：1.使用强大且先进的深度学习检测框架，使得检测结果更加的可靠。2.在可靠性提升的基础上并不会增加用户的等待时间，不会影响到用户的主管使用体验。3.与纯人工监管相比，大大提升了工作效率，一定程度上缓解了使用人力带来的不定因素。4.大大减少了社交软件上不良或低俗信息的发布，对于净化网络环境和风气，给青少年营造出一个健康良好的成长氛围具有重大的意义。

附图说明

图1是本发明方法流程图

图2是优选实施例方式的模板匹配示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

本发明实施例提供的一种基于深度学习的社交软件发布内容的实时检测方法，通过利用深度神经网络检测模型进行图像文字区域的检测、分类，然后结合标注的模板信息与检测分类得到的带类别的文字区域信息，进行模板匹配，生成结构化信息数据，能够针对如票据图像中各种字段，实现快速、准确的检测分析，对于文档图像的检测与分析具有实时、准确、通用、鲁棒、可扩展的特点，可广泛应用于多种包含文本的图像文本检测、分析与识别领域中。

图1具体的包括以下步骤：

步骤1：进行模板标注，生成标注模板信息。

进一步的，标注模板锚点和非锚点文字区域的大小及相对位置，以及实体与锚点、非锚点文字区域的映射关系，生成标注模板信息。这一过程用于标注所有需要识别字段的位置和类别，类别包括是否为锚点，文字行是否为日期、汉字、英文等等。生成的标注模板信息用于后续的模板匹配。

需要注意的是，这里进行标注的模板并不限于一种或两种，根据实际需要，可以预先设置多种模板。

步骤2：利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类，生成带类别的文字区域信息。

进一步的，利用预设深度神经网络检测模型检测待检测图像的文字行，通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。使用检测模型检测文字行，通过输出的类别就可以获取所有锚点，这个过程中也可以筛选置信度最高的锚点，通过锚点就可以确定版面的相对位置。这里的预设深度网络检测模型可以采用faster-rcnn网络模型、mask-rcnn网络模型或者现有技术中其他任何可能的深度神经网络模型，本发明实施例不对其加以特别限制。

采用深度神经网络物体检测框架能够精准找出不同尺度(字号)的文字区域，并对文字内容进行初步分类，锚点确定了，相当于确定了整个版面各个字段的相对位置，然后结合之前的检测结果和版面的相对位置就可以准确的定位想要的字段对位置和内容信息，因此稳定的锚点能够实现准确的匹配，提升后续匹配步骤的准确率。

步骤3：根据标注模板信息和带类别的文字区域信息进行模板匹配，生成结构化信息数据。

进一步的，将标注模板信息与带类别的文字区域信息作为输出，匹配定位锚点，并通过锚点将带类别的文字区域映射到对应的实体，去除包括非文本区域和无关文本在内的冗余部分，生成结构化信息。根据检测出的文字行与锚点的相对位置，就可以确定该文字行的类型，识别之后就可以将结果结构化。然后可以将结构化信息输出，以便进行相应应用。这里涉及的识别过程可以采用现有技术中tessract、CRNN之类的识别模型，本发明实施例不对其加以特别限制。

图2是一优选实施方式的模板匹配过程示意图，如图2所示，上述步骤3又可进一步包括：

301：结合标注模板信息与带类别的文字区域信息进行模板匹配；

302：结合标注模板信息、带类别的文字区域信息以及匹配成功的锚点进行文字区域的映射；

303:将映射的结果去重，去除重复冗余的文字区域；

304:将完整的检测结果根据模板信息结构化，完成模板匹配。

根据通过检验得到的文字检出区域的相对位置，匹配标注模板，排除非文本区域与无关文本，比通用识别方法更能抓住关键信息。

进一步的，本发明实施例提供的一种基于深度学习的社交软件发布内容的实时检测方法除了包括以上步骤1—步骤3外，还包括以下步骤：

对输入的待检测图像进行图像预处理，图像预处理包括但不限于图像矫正和/或缩放到统一尺寸，可以根据实际情况进行图像预处理操作的相应设置。

另外，进一步的，本发明实施例提供的基于深度神经网络的文本检测分析方法，还包括以下步骤：

训练获得预设深度神经网络检测模型，具体地包括：

使用样本生成工具生成样本；

使用样本进行训练；

获得初步深度神经网络检测模型；

在检测应用中形成数据回流，获得更多的新样本

用新样本在初步深度神经网络检测模型上进行Fine-tuning。

在上述过程中，会对样本中的文字行分类(包括但不限于进行锚点类和非锚点类的分类)，然后训练检测模型。

对图像而言，直接输入到训练好的模型之中，对视频而言，进行在线图像动态截取之后输入到训练好的模型之中进行检测，如若检测出来的结果属于不良或低俗类的标签则不允许发布。

尽管已描述了本申请实施例中的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1. 一种基于深度学习的社交软件用户发布内容的实时检测方法，其特征在于：所述方法包括：进行模板标注，生成标注模板信息；利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类，生成带类别的文字区域信息；根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配，生成结构化信息数据。

2.根据权利要求1所述的方法，其特征在于，进行模板标注，生成标注模板信息，包括：标注模板锚点和非锚点文字区域的大小及相对位置，以及实体与所述锚点、非锚点文字区域的映射关系，生成标注模板信息。

3.根据权利要求1所述的方法，其特征在于，利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类，生成带类别的文字区域信息，包括：利用预设深度神经网络检测模型检测待检测图像的文字行，通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。

4. 根据权利要求1所述的方法，其特征在于，根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配，生成结构化信息数据，包括：将所述标注模板信息与所述带类别的文字区域信息作为输出，匹配定位锚点，并通过锚点将所述带类别的文字区域映射到对应的实体，去除包括非文本区域和无关文本在内的冗余部分，生成结构化信息。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：对输入的待检测图像进行图像预处理，所述图像预处理包括图像矫正和/或缩放到统一尺寸。

6.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：训练获得所述预设深度神经网络检测模型。

7.根据权利要求6所述的方法，其特征在于，训练获得所述预设深度神经网络检测模型，包括：使用样本生成工具生成样本；使用样本进行训练获得初步深度神经网络检测模型；在检测应用中形成数据回流，获得更多的新样本；用新样本在初步深度神经网络检测模型上进行Fine-tuning。