CN109145919A - 一种不文明标语检测方法及装置 - Google Patents

一种不文明标语检测方法及装置 Download PDF

Info

Publication number
CN109145919A
CN109145919A CN201810951192.2A CN201810951192A CN109145919A CN 109145919 A CN109145919 A CN 109145919A CN 201810951192 A CN201810951192 A CN 201810951192A CN 109145919 A CN109145919 A CN 109145919A
Authority
CN
China
Prior art keywords
uncivil
poster
image
word
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810951192.2A
Other languages
English (en)
Inventor
廖海斌
肖春红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Is Suitable For Zhitong Technology Co Ltd
Original Assignee
Guizhou Is Suitable For Zhitong Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Is Suitable For Zhitong Technology Co Ltd filed Critical Guizhou Is Suitable For Zhitong Technology Co Ltd
Priority to CN201810951192.2A priority Critical patent/CN109145919A/zh
Publication of CN109145919A publication Critical patent/CN109145919A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种不文明标语检测方法及装置,涉及字符识别技术领域。所述不文明标语检测方法首先读取待检测图像,确定所述待检测图像中包含有横幅图像,然后采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集,并基于关键词字典,计算所述字符图像集的稀疏度,再判断所述稀疏度是否大于预设阈值,若是,确定所述待检测图像中包含有不文明标语。所述不文明标语检测方法通过从待检测图像中提取字符图像集并基于其稀疏度确定所述待检测图像中是否有不文明标语,使不文明标语的检测能够自动化进行,在提高了不文明标语检测准确度和效率的同时降低了人力成本。

Description

一种不文明标语检测方法及装置
技术领域
本发明涉及字符识别技术领域,具体而言,涉及一种不文明标语检测方法及装置。
背景技术
随着文化朝着多元化的迅速发展以及人们对宣传手段的重视,在宽松自由的文化氛围中越来越多的人会在学校、街道、小区或其他区域内将各种内容的标语通过横幅、涂鸦等方式公示出来。但是众多标语中可能会包含有不文明的标语,例如涉及虚假宣传、涉黄涉暴的标语等。此类标语会对社会风气产生不良影响,因此需要对不文明标语进行严格监控,一旦在学校、街道、小区或其他场所的标语中检查到不文明标语应当迅速进行处理。
但是,由于现在各场所的横幅数量巨大,通过人工方式对所有横幅上的标语进行一一排查会消耗大量的人力物力,人力成本较高,同时通过人工方式进行筛查往往会存在检测效率低、不文明标语遗漏的情况。
发明内容
有鉴于此,本发明实施例的目的在于提供一种不文明标语检测方法及装置,以解决上述现有的人工标语排查方式存在的人力成本高、检测效率低和遗漏不文明标语的问题。
第一方面,本发明实施例提供了一种不文明标语检测方法,所述不文明标语检测方法首先读取待检测图像,确定所述待检测图像中包含有横幅图像,然后采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集,并基于关键词字典,计算所述字符图像集的稀疏度,再判断所述稀疏度是否大于预设阈值,若是,确定所述待检测图像中包含有不文明标语。
综合第一方面,所述确定所述待检测图像中包含有横幅图像,包括:采用卷积神经网络物体检测模型对所述待检测图像进行横幅检测,确定所述待检测图像中包含有横幅图像。
综合第一方面,所述采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集,包括:将字符切割滑动窗口的窗口字符长度设置为第一预设字符数;采用所述字符切割滑动窗口从所述横幅图像中切割获取所有相邻的具有第一预设字符数的字符图像;所有所述字符图像组成对应的字符图像集。
综合第一方面,在所述基于关键词字典,计算所述字符图像集的稀疏度之前,所述不文明标语检测方法还包括:采集字符数为所述第一预设字符数的不文明用词;将所述不文明用词图像化获得不文明用词图像,对所述不文明用词图像进行归一化处理;获得归一化处理后的所述不文明用词图像的特征向量,基于所述特征向量构建第一数据集;根据所述第一数据集获得所述关键词字典。
综合第一方面,所述将所述不文明用词图像化获得不文明用词图像,包括:在文字处理程序中对所述不文明用词进行输入显示;采集每个不文明用词在所述文字处理程序中对应不同字符参数的字符图像,将所述字符图像作为所述不文明用词图像。
综合第一方面,所述根据所述第一数据集获得所述关键词字典,包括:基于鉴别保真和鉴别约束,通过对所述第一数据集的优化训练获得所述关键词字典。
综合第一方面,每个相邻的具有第一预设字符数的字符图像为所述字符图像集的图像元素,所述算所述字符图像集的稀疏度,包括:基于关键词字典,采用L1/2正则子的求解公式计算获得所述字符图像对应的稀疏表示模型的稀疏表示系数矩阵;基于所述稀疏表示系数矩阵,采用稀疏度计算公式获得所述字符图像集的稀疏度。
综合第一方面,在所述确定所述待检测图像中包含有不文明标语之后,所述不文明标语检测方法还包括:将所述稀疏表示系数矩阵转化为系数向量;计算所述系数向量与所述关键词字典的至少一类残差;基于所述至少一类残差确定所述不文明标语的不文明程度。
第二方面,本发明实施例提供了一种不文明标语检测装置,所述不文明标语检测装置包括横幅图像获取模块、字符切割模块、稀疏度计算模块和不文明标语确定模块。所述横幅图像获取模块用于读取待检测图像,确定所述待检测图像中包含有横幅图像。所述字符切割模块用于采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集。所述稀疏度计算模块用于基于关键词字典,计算所述字符图像集的稀疏度。所述不文明标语确定模块用于判断所述稀疏度是否大于预设阈值,若是,确定所述待检测图像中包含有不文明标语。
第三方面,本发明实施例还提供了一种存储介质,所述存储介质存储于计算机内,所述存储介质包括多条指令,所述多条指令被设置成使得所述计算机执行上述各方面的方法。
本发明提供的有益效果是:
本发明提供了一种不文明标语检测方法及装置,所述不文明标语检测方法利用处理设备通过横幅图像获取标语内容,减少了人工成本的同时提高了标语读取效率。同时采用字符切割使所述处理设备将标语中的字符划分为不同字符数的用词,进而对不同字符数的用词分批次进行后续检测,提高了不文明标语检测的准确度。进一步地,所述不文明标语检测方法基于关键词字典和所述横幅中标语的字符图像集的稀疏度进行具体地标语不文明判断,提高了不文明标语检测的准确性,此外,通过可调整优化的关键词字典提高了所述不文明标语检测方法的适应性和灵活性。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明第一实施例提供的一种不文明标语检测方法的流程示意图;
图2为本发明第一实施例提供的一种字符切割步骤的流程示意图;
图3为本发明第一实施例提供的一种关键词字典获取步骤的流程示意图;
图4为本发明第二实施例提供的一种不文明标语检测装置的模块示意图;
图5为本发明第三实施例提供的一种可应用于本申请实施例中的电子设备的结构框图。
图标:100-不文明标语检测装置;110-横幅图像获取模块;120-字符切割模块;125-关键词字典生成模块;130-稀疏度计算模块;140-不文明标语确定模块;150-不文明程度判断模块;200-电子设备;201-存储器;202-存储控制器;203-处理器;204-外设接口;205-输入输出单元;206-音频单元; 207-显示单元。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
第一实施例
经本申请人研究发现,随着文化氛围的越加开放和自由,小区、街道、学校等场所中的标语量迅速增加,而对标语的文明监督任务的强度也随之迅速提高,传统的人工检测方式即工作人员通过肉眼观察和判断标语内容是否包含不文明内容的方式已经无法满足现今社会对不文明标语检测速度的需求。为了解决上述问题,本发明第一实施例提供了一种不文明标语检测方法。
请参考图1,图1为本发明第一实施例提供的一种不文明标语检测方法的流程示意图。所述不文明标语检测方法可以包含如下步骤;
步骤S10:检测服务器读取待检测图像,确定所述待检测图像中包含有横幅图像。
步骤S20:所述检测服务器采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集。
步骤S30:所述检测服务器基于关键词字典,计算所述字符图像集的稀疏度。
步骤S40:所述检测服务器判断所述稀疏度是否大于预设阈值。
步骤S50:若是,确定所述待检测图像中包含有不文明标语。
针对步骤S10,所述待检测图像可以是所述检测服务器控制航拍无人机或区域监控摄像头进行拍摄采集,还可以是直接从其他数据库中获取。应当理解的是,所述检测服务器可以是个人电脑、云服务器、图像处理器或其他任何能够具备所述不文明标语检测方法所需的图像处理能力的处理设备。
可选地,所述步骤“确定所述待检测图像中包含有横幅图像”可以是:采用卷积神经网络物体检测模型对所述待检测图像进行横幅检测,确定所述待检测图像中包含有横幅图像。其中,所述卷积神经网络物体检测模型即Faster-RCNN,其能够对感兴趣的候选区域进行精准、快速的目标检测,从而使横幅检测具备更快的速度和更高的准确性。
对于步骤S20,即:所述检测服务器采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集。其中,所述第一预设字符数可以根据具体需求设置为2、3、4或其他数字,所述第一预设字符数一般不超过10。此外,所述字符切割用于将每一个或多个字符从图片中切割下来。
针对步骤S30,所述关键词字典是由一个或多个不文明用词数据集组成,所述两个字、三个字、四个字或其他字符数的不文明用词分别被采集进不同字符数对应的不文明用词数据集。同时,所述不文明数据集可以直接作为所述关键词字典使用,也可以在优化后纳入所述关键词字典。进一步地,所述关键词字典可以根据学校、社区、街道等场景的不同以及不文明用词审查严格程度进行选择和调整。
对于步骤S40,所述预设阈值的设定可以根据学校、社区、街道等场景的不同以及不文明用词审查严格程度进行调整。
应当理解的是,在实际的不文明标语检测过程中,需要对所述标语中的字符数为2、3、4至任意数值的字符图像集进行检测,则需要将所述第一预设字符数进行调整后重复上述步骤,以检测标语中是否包含不同字符数的不文明标语。
本实施例通过上述步骤S10-S40利用检测服务器对横幅图像进行识别和检测,使不文明标语检测的过程更加自动化,减少了人力成本,提高了整体检测效率;并基于关键词字典对从所述横幅图像中切割出的字符图像集进行稀疏度计算,进一步提高了不文明标语检测的自动化程度,同时提高了不文明标语识别的速度和准确率。
作为一种实施方式,请参考图2,图2为本发明第一实施例提供的一种字符切割步骤的流程示意图,步骤S20中的字符切割步骤可以包括如图2 所示的如下步骤:
步骤S21:所述检测服务器将字符切割滑动窗口的窗口字符长度设置为第一预设字符数。
步骤S22:所述检测服务器采用所述字符切割滑动窗口从所述横幅图像中切割获取所有相邻的具有第一预设字符数的字符图像。
步骤S23:所述检测服务器所有所述字符图像组成对应的字符图像集。
其中,在需要对标语中不同字符数的词语进行检测时,可以通过重设所述第一预设字符数并再次执行步骤S21-S23以获得不同字符数的不文明词语对应的字符图像集。
作为一种实施方式,在执行步骤S30之前,还需要获得所述关键词字典。请参考图3,图3为本发明第一实施例提供的一种关键词字典获取步骤的流程示意图。所述关键词字典获取步骤可以如下:
步骤S24:所述检测服务器采集字符数为所述第一预设字符数的不文明用词。
步骤S25:所述检测服务器将所述不文明用词图像化获得不文明用词图像,对所述不文明用词图像进行归一化处理。
步骤S26:所述检测服务器获得归一化处理后的所述不文明用词图像的特征向量,基于所述特征向量构建第一数据集。
步骤S27:所述检测服务器根据所述第一数据集获得所述关键词字典。
对于步骤S24,不文明用词的采集来源可以是网络、词典、现有不文明用词数据库等。
针对步骤S25,所述“将所述不文明用词图像化获得不文明用词图像”可以包括如下步骤:在文字处理程序中对所述不文明用词进行输入显示;采集每个不文明用词在所述文字处理程序中对应不同字符参数的字符图像,将所述字符图像作为所述不文明用词图像。其中,所述文字处理程序可以是Word、WPS等常用的文字处理程序。所述不同字符参数可以包括字体、字号,作为一种可选的实施方式,本实施例对每个不文明用词进行三种字号(大号、中号、小号)以及六种字体(宋体、楷体、篆体、行体、隶体和仿宋体)的变换获得共3*8=16幅不文明用词图像,从而增加了样本多样性,从而提高了所述关键词字典的适用性和精确度。
对于步骤S26,所述特征向量的提取可以是提取所述不文明用词图像的 Gabor特征作为特征向量。其中,所述Gabor函数在图像处理中是一个用于边缘提取的线性滤波器,在空间域中,一个二维Gabor滤波器是一个由正弦平面波调制的高斯核函数,Gabor分为实部和虚部,用实部进行滤波后图像会平滑;虚部滤波后用来检测边缘。例如,收集100个具两个字的不文明用词,每个不文明用词具有18种不同的字符参数形式,提取的Gabor特征维数为500,则最后构建的两个字的不文明数据集为A1∈X500×100*18,其中 A1为第一预设字符数的不文明用词组成的第一不文明数据集。
针对步骤S27,所述步骤S27可以具体为“基于鉴别保真和鉴别约束,通过对所述第一数据集的优化训练获得所述关键词字典”。其中,基于鉴别保真和鉴别约束的优化目标函数可以为:
其中,r(A2,D2,X)为鉴别保真项,||X||1为稀疏约束项,f(X)为鉴别约束项,λ12为平衡因子参数。可选地,本实施例中的所述鉴别保真项为:本实施例中的加权Fisher准则鉴别约束项为:其中,SW和SB分别为加权处理后的类内和类间散布矩阵。
可选地,每个相邻的具有第一预设字符数的字符图像为所述字符图像集S1的图像元素s1,则对于步骤S40中所述“计算所述字符图像集的稀疏度”可以包括如下子部骤:基于关键词字典,采用L1/2正则子的求解公式计算获得所述字符图像对应的稀疏表示模型的稀疏表示系数矩阵;基于所述稀疏表示系数矩阵,采用稀疏度计算公式获得所述字符图像集的稀疏度。其中,所述L1/2正则子的求解公式为:所述稀疏度计算公式为:其中,k为类别数,x 是所述L1/2正则子的求解公式中求解出的稀疏表示系数矩阵,δi(x)是一个新的向量,其非0项仅选择与第i类相对应的项,其它项全为0,||·||1为向量中非0元素的个数。如果SCI(x)=1,待检测图像仅由某类的一个对象表示,表明具有很好的分类效果,即被检测的图像元素为不文明标语;如果 SCI(x)=0,表征系数分布在整个训练集中,表明待检测图像不属于其中任何一个类,即被检测的图像元素不与任何不文明标语对应。本发明实施例给定一个阀值θ,如果SCI(x)<θ,则认为待检测图像不属于不文明标语;否则,则认为属于不文明标语。其中,所述阀值θ的值可以根据小区、街道、社区不同的文明指数要求进行调节,进一步提高不文明标语检测的适应性。
作为一种实施方式,本实施例在执行步骤S50后,还会通过以下步骤对所述不文明标语的具体不文明程度进行判断:将所述稀疏表示系数矩阵转化为系数向量;计算所述系数向量与所述关键词字典的至少一类残差;基于所述至少一类残差确定所述不文明标语的不文明程度。其中,所述“将所述稀疏表示系数矩阵转化为系数向量”的步骤具体为:将稀疏表示系数转化为其中,系数向量对应于子字典所述“基于所述至少一类残差确定所述不文明标语的不文明程度”的步骤具体包括:根据和残差计算公式定义每类的残差,其中,第一项为第i类的重构误差项,第二项为稀疏表示系数与第i类系数均值μi(在字典训练时得到)的距离,w为预设的平衡权值;对ei进行排序,选取最小的ei所对应的类别确定最终的不文明程度。应当理解的是,在不文明程度低于一定阈值时,可以判定所述待检测图像中不包含不文明标语,进一步提高了不文明标语判定的精确度。
第二实施例
为了配合本发明第一实施例提供的所述不文明标语检测方法,本发明第二实施例提供了一种不文明标语检测装置100。
请参考图4,图4为本发明第二实施例提供的一种不文明标语检测装置的模块示意图。
不文明标语检测装置100包括横幅图像获取模块110、字符切割模块 120、稀疏度计算模块130和不文明标语确定模块140。
横幅图像获取模块110,用于读取待检测图像,确定所述待检测图像中包含有横幅图像。
字符切割模块120,用于采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集。
稀疏度计算模块130,用于基于关键词字典,计算所述字符图像集的稀疏度。
不文明标语确定模块140,用于判断所述稀疏度是否大于预设阈值,若是,确定所述待检测图像中包含有不文明标语。
作为一种实施方式,字符切割模块120还用于将字符切割滑动窗口的窗口字符长度设置为第一预设字符数,采用所述字符切割滑动窗口从所述横幅图像中切割获取所有相邻的具有第一预设字符数的字符图像。
作为一种实施方式,不文明标语检测装置100还包括关键词字典生成模块125,所述关键词字典生成模块125用于采集字符数为所述第一预设字符数的不文明用词,将所述不文明用词图像化获得不文明用词图像,对所述不文明用词图像进行归一化处理,获得归一化处理后的所述不文明用词图像的特征向量,基于所述特征向量构建第一数据集,根据所述第一数据集获得所述关键词字典。
进一步地,不文明标语检测装置100还包括不文明程度判断模块150,所述不文明程度判断模块150用于将所述稀疏表示系数矩阵转化为系数向量,计算所述系数向量与所述关键词字典的至少一类残差,基于所述至少一类残差确定所述不文明标语的不文明程度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
第三实施例
请参照图5,图5为本发明第三实施例提供的一种可应用于本申请实施例中的电子设备的结构框图。电子设备200可以包括不文明标语检测装置 100、存储器201、存储控制器202、处理器203、外设接口204、输入输出单元205、音频单元206、显示单元207。
所述存储器201、存储控制器202、处理器203、外设接口204、输入输出单元205、音频单元206、显示单元207各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述不文明标语检测装置100 包括至少一个可以软件或固件(firmware)的形式存储于所述存储器201中或固化在不文明标语检测装置100的操作***(operating system,OS)中的软件功能模块。所述处理器203用于执行存储器201中存储的可执行模块,例如不文明标语检测装置100包括的软件功能模块或计算机程序。
其中,存储器201可以是,但不限于,随机存取存储器 (Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器201用于存储程序,所述处理器203在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的服务器所执行的方法可以应用于处理器203中,或者由处理器203实现。
处理器203可以是一种集成电路芯片,具有信号的处理能力。上述的处理器203可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器203也可以是任何常规的处理器等。
所述外设接口204将各种输入/输出装置耦合至处理器203以及存储器 201。在一些实施例中,外设接口204,处理器203以及存储控制器202可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元205用于提供给用户输入数据实现用户与所述服务器(或本地终端)的交互。所述输入输出单元205可以是,但不限于,鼠标和键盘等设备。
音频单元206向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元207在所述电子设备200与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元207可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器203进行计算和处理。
可以理解,图5所示的结构仅为示意,所述电子设备200还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5 中所示的各组件可以采用硬件、软件或其组合实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上所述,本发明实施例提供了一种不文明标语检测方法及装置,所述不文明标语检测方法利用处理设备通过横幅图像获取标语内容,减少了人工成本的同时提高了标语读取效率。同时采用字符切割使所述处理设备将标语中的字符划分为不同字符数的用词,进而对不同字符数的用词分批次进行后续检测,提高了不文明标语检测的准确度。进一步地,所述不文明标语检测方法基于关键词字典和所述横幅中标语的字符图像集的稀疏度进行具体地标语不文明判断,提高了不文明标语检测的准确性,此外,通过可调整优化的关键词字典提高了所述不文明标语检测方法的适应性和灵活性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种不文明标语检测方法,其特征在于,所述不文明标语检测方法包括:
读取待检测图像,确定所述待检测图像中包含有横幅图像;
采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集;
基于关键词字典,计算所述字符图像集的稀疏度;
判断所述稀疏度是否大于预设阈值,若是,确定所述待检测图像中包含有不文明标语。
2.根据权利要求1所述的不文明标语检测方法,其特征在于,所述确定所述待检测图像中包含有横幅图像,包括:
采用卷积神经网络物体检测模型对所述待检测图像进行横幅检测,确定所述待检测图像中包含有横幅图像。
3.根据权利要求1所述的不文明标语检测方法,其特征在于,所述采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集,包括:
将字符切割滑动窗口的窗口字符长度设置为第一预设字符数;
采用所述字符切割滑动窗口从所述横幅图像中切割获取所有相邻的具有第一预设字符数的字符图像;
所有所述字符图像组成对应的字符图像集。
4.根据权利要求1-3中任一项所述的不文明标语检测方法,其特征在于,在所述基于关键词字典,计算所述字符图像集的稀疏度之前,所述不文明标语检测方法还包括:
采集字符数为所述第一预设字符数的不文明用词;
将所述不文明用词图像化获得不文明用词图像,对所述不文明用词图像进行归一化处理;
获得归一化处理后的所述不文明用词图像的特征向量,基于所述特征向量构建第一数据集;
根据所述第一数据集获得所述关键词字典。
5.根据权利要求4所述的不文明标语检测方法,其特征在于,所述将所述不文明用词图像化获得不文明用词图像,包括:
在文字处理程序中对所述不文明用词进行输入显示;
采集每个不文明用词在所述文字处理程序中对应不同字符参数的字符图像,将所述字符图像作为所述不文明用词图像。
6.根据权利要求4所述的不文明标语检测方法,其特征在于,所述根据所述第一数据集获得所述关键词字典,包括:
基于鉴别保真和鉴别约束,通过对所述第一数据集的优化训练获得所述关键词字典。
7.根据权利要求1所述的不文明标语检测方法,其特征在于,每个相邻的具有第一预设字符数的字符图像为所述字符图像集的图像元素,所述算所述字符图像集的稀疏度,包括:
基于关键词字典,采用L1/2正则子的求解公式计算获得所述字符图像对应的稀疏表示模型的稀疏表示系数矩阵;
基于所述稀疏表示系数矩阵,采用稀疏度计算公式获得所述字符图像集的稀疏度。
8.根据权利要求1所述的不文明标语检测方法,其特征在于,在所述确定所述待检测图像中包含有不文明标语之后,所述不文明标语检测方法还包括:
将所述稀疏表示系数矩阵转化为系数向量;
计算所述系数向量与所述关键词字典的至少一类残差;
基于所述至少一类残差确定所述不文明标语的不文明程度。
9.一种不文明标语检测装置,其特征在于,所述不文明标语检测装置包括:
横幅图像获取模块,用于读取待检测图像,确定所述待检测图像中包含有横幅图像;
字符切割模块,用于采用字符切割从所述横幅图像中获取所有相邻的具有第一预设字符数的字符图像组成的字符图像集;
稀疏度计算模块,用于基于关键词字典,计算所述字符图像集的稀疏度;
不文明标语确定模块,用于判断所述稀疏度是否大于预设阈值,若是,确定所述待检测图像中包含有不文明标语。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行权利要求1-8任一项所述方法中的步骤。
CN201810951192.2A 2018-08-20 2018-08-20 一种不文明标语检测方法及装置 Pending CN109145919A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810951192.2A CN109145919A (zh) 2018-08-20 2018-08-20 一种不文明标语检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810951192.2A CN109145919A (zh) 2018-08-20 2018-08-20 一种不文明标语检测方法及装置

Publications (1)

Publication Number Publication Date
CN109145919A true CN109145919A (zh) 2019-01-04

Family

ID=64790258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810951192.2A Pending CN109145919A (zh) 2018-08-20 2018-08-20 一种不文明标语检测方法及装置

Country Status (1)

Country Link
CN (1) CN109145919A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011683A (ja) * 2005-06-30 2007-01-18 Fuji Xerox Co Ltd 文書管理支援装置
CN107392111A (zh) * 2017-06-27 2017-11-24 青岛海信电器股份有限公司 广告识别方法及装置
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种***中关键信息的识别方法及计算设备
CN107992846A (zh) * 2017-12-15 2018-05-04 贵阳宏益房地产开发有限公司 遮挡人脸识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011683A (ja) * 2005-06-30 2007-01-18 Fuji Xerox Co Ltd 文書管理支援装置
CN107392111A (zh) * 2017-06-27 2017-11-24 青岛海信电器股份有限公司 广告识别方法及装置
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种***中关键信息的识别方法及计算设备
CN107992846A (zh) * 2017-12-15 2018-05-04 贵阳宏益房地产开发有限公司 遮挡人脸识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郝宁波等: "基于字典学习与稀疏表达分类的低质量字符识别", 《华南理工大学学报(自然科学版)》 *

Similar Documents

Publication Publication Date Title
US11238310B2 (en) Training data acquisition method and device, server and storage medium
Liu et al. Image and texture segmentation using local spectral histograms
Weaver et al. LeafMachine: Using machine learning to automate leaf trait extraction from digitized herbarium specimens
CN106408030B (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
CN103679190B (zh) 分类装置、分类方法以及电子设备
CN104487843A (zh) 图像处理装置、程序、图像处理方法、计算机可读介质及图像处理***
CN105303169B (zh) 一种基于慢特征的细胞***识别方法及其识别装置
CN111709941B (zh) 一种面向病理图像的轻量级自动化深度学习***及方法
CN109858570A (zh) 图像分类方法及***、计算机设备及介质
WO2022193753A1 (zh) 持续学习方法、装置、终端及存储介质
CN108986125A (zh) 物体边缘提取方法、装置及电子设备
CN109241962A (zh) 一种字符识别方法及装置
CN106056161A (zh) 一种针对平面旋转目标的视觉检测方法
CN114863125A (zh) 一种书法/美术作品智能评分方法及***
CN104899578A (zh) 一种人脸识别的方法及装置
CN109741351A (zh) 一种基于深度学习的类别敏感型边缘检测方法
CN112836754A (zh) 一种面向图像描述模型泛化能力评估方法
CN110069648A (zh) 一种图像检索方法及装置
CN105844299B (zh) 一种基于词袋模型的图像分类方法
CN117197479A (zh) 一种应用玉米果穗外表面的图像分析方法、装置、计算机设备及存储介质
Alvarez-Lopez et al. GSpyNetTree: a signal-vs-glitch classifier for gravitational-wave event candidates
Zhang et al. A YOLOv3‐Based Industrial Instrument Classification and Reading Recognition Method
CN109145919A (zh) 一种不文明标语检测方法及装置
CN115512331A (zh) 一种交通标志检测方法、装置、计算机设备及计算机可读存储介质
Ahonen et al. Morphological clustering of cell cultures based on size, shape, and texture features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190104