CN111339803B - 字体识别方法、装置、设备及计算机可读存储介质 - Google Patents

字体识别方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111339803B
CN111339803B CN201811555857.4A CN201811555857A CN111339803B CN 111339803 B CN111339803 B CN 111339803B CN 201811555857 A CN201811555857 A CN 201811555857A CN 111339803 B CN111339803 B CN 111339803B
Authority
CN
China
Prior art keywords
font
image
data
model
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811555857.4A
Other languages
English (en)
Other versions
CN111339803A (zh
Inventor
郭培龙
王守强
程立双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Founder Holdings Development Co ltd, Beijing Founder Electronics Co Ltd filed Critical New Founder Holdings Development Co ltd
Priority to CN201811555857.4A priority Critical patent/CN111339803B/zh
Publication of CN111339803A publication Critical patent/CN111339803A/zh
Application granted granted Critical
Publication of CN111339803B publication Critical patent/CN111339803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供一种字体识别方法、装置、设备及计算机可读存储介质,方法包括:接收拍摄模块拍摄的字体图像;对所述字体文件进行预处理;将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。从而能够快速地获取到用户喜欢的字体的名称,以使用户根据该字体名称进行字体的下载以及使用,提高用户体验。

Description

字体识别方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种字体识别方法、装置、设备及计算机可读存储介质。
背景技术
随着字体设计的蓬勃发展,越来越多不同风格的字体出现在社会的各个角落。当用户看到心仪的字体时,往往向知道该字体的名称,以便后续对该字体进行获取与使用,因此,如何是用户及时了解这些字体的名称和与其风格相似的字体名称,达到所见即所得的效果,即成为了亟待解决的问题。
传统的字体识别算法主要是特征提取法,通过SIFT、小波多层分解等传统算法抽取待识别字体图片的浅层特征,然后将这些特征按一定规则组合,与字体文件(True TypeFont,简称TTF)生成的特征库进行相似度匹配计算,最终选择相似度值最大的一个结果作为待识别字体的名称。
但由于采用上述传统的字体识别方案需要对待识别字体图片进行必要的图像预处理(去噪音、去模糊、倾斜矫正等),会间接丢失待识别字体图片的部分字体特征,导致识别精度不高,从而无法快速精准地识别出用户当前所喜欢的字体的名称,进而导致用户体验较差。
发明内容
本发明提供一种字体识别方法、装置、设备及计算机可读存储介质,用于解决现有技术中由于需要对待识别字体图片进行必要的图像预处理从而导致无法快速精准地识别出用户当前所喜欢的字体的名称的技术问题。
本发明的第一个方面是提供一种字体识别方法,包括:
接收拍摄模块拍摄的字体图像;
对所述字体文件进行预处理;
将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
本发明的另一个方面是提供一种字体识别装置,包括:
字体图像接收模块,用于接收拍摄模块拍摄的字体图像;
预处理模块,用于对所述字体文件进行预处理;
识别模块,用于将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
本发明的又一个方面是提供一种字体识别设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如上述的字体识别方法。
本发明的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的字体识别方法。
本发明提供的字体识别方法、装置、设备及计算机可读存储介质,通过接收拍摄模块拍摄的字体图像;对所述字体文件进行预处理;将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。从而能够快速地获取到用户喜欢的字体的名称,以使用户根据该字体名称进行字体的下载以及使用,提高用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明所基于的网络架构图;
图2为本发明实施例一提供的字体识别方法的流程示意图;
图3为本发明实施例二提供的字体识别方法的流程示意图;
图4为本发明实施例三提供的字体识别装置的结构示意图;
图5为本发明实施例四提供的字体识别设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。
传统的字体识别算法主要是特征提取法,通过SIFT、小波多层分解等传统算法抽取待识别字体图片的浅层特征,然后将这些特征按一定规则组合,与字体文件(True TypeFont,简称TTF)生成的特征库进行相似度匹配计算,最终选择相似度值最大的一个结果作为待识别字体的名称。但由于采用上述传统的字体识别方案需要对待识别字体图片进行必要的图像预处理(去噪音、去模糊、倾斜矫正等),会间接丢失待识别字体图片的部分字体特征,导致识别精度不高,从而无法快速精准地识别出用户当前所喜欢的字体的名称,进而导致用户体验较差。为了解决上述技术问题,本发明提供了一种字体识别方法、装置、设备及计算机可读存储介质。
需要说明的是,本发明提供的字体识别方法、装置、设备及计算机可读存储介质能够应用在任意一种字体识别的场景中。
图1为本发明所基于的网络架构图,如图1所示,本发明所基于的网络架构至少包括字体识别装置1以及拍摄模块2。其中,字体识别装置1具体可以由软件和/或硬件实现,当其采用软件实现时,可以采用C语言、Java等编写。拍摄模块2可以为用户终端中设置的摄像头或者独立的相机或者摄像机等。字体识别装置1可以设置在用户终端中,也可以为独立的装置,相应地,拍摄模块2可以设置在用户终端中,也可以为独立的相机或者摄像机等,本发明在此不做限制。需要说明的是,字体识别装置1可以通过有线或者无线的方式与拍摄模块2进行通信,实现数据交互,具体地,当字体识别装置1以及拍摄模块2均设置在用户终端中时,二者可以通过有线的方式进行通信,当二者不设置在同一个终端内,则可以通过无线的方式进行通信。
图2为本发明实施例一提供的字体识别方法的流程示意图,在上述实施例的基础上,所述方法包括:
步骤101、接收拍摄模块拍摄的字体图像。
本实施例的执行主体为字体识别装置,字体识别装置可以通过有线或者无线的方式与拍摄模块进行通信,实现数据交互。具体地,用户在发现自己喜欢的字体的时候,可以通过拍摄模块对该字体进行拍摄,获得该字体的字体图像,并通过有线或者无线的方式将该字体图像发送至字体识别装置。相应地,字体识别装置可以接受拍摄模块发送的字体图像。
作为一种可以实施的方式,该字体图像也可以为用户在通过用户终端浏览某一界面时,对心仪的字体的截图,也可以为其他任意形式获得的字体图像,本发明在此不做限制。
步骤102、对所述字体图像进行预处理。
在本实施方式中,为了提高字体识别的精度,字体识别装置在接收到该字体图像之后,可以对该字体图像进行预处理,获得与处理后的字体图像。
步骤103、将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
在本实施方式中,为了实现对字体的识别,可以预先设置一个字体识别模型,对该字体图像进行预处理,获得与处理后的字体图像之后,可以将该处理后的字体图像添加至该字体识别模型中,实现对用户心仪的字体的识别,获得该字体的名称。相应地,获得该字体的名称之后,可以将该字体的名称显示在用户终端的显示屏上,进而用户可以根据该字体名称对字体进行下载以及使用等操作。
可以理解的是,获得预处理后的字体图像之后,一方面可以如上述实施方式中一样采用预设的字体识别模型实现对字体的识别,此外,还可以采用其他任意一种识别方式实现对字体的识别,本发明在此不做限制。
本实施例提供的字体识别方法,通过接收拍摄模块拍摄的字体图像;对所述字体文件进行预处理;将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。从而能够快速地获取到用户喜欢的字体的名称,以使用户根据该字体名称进行字体的下载以及使用,提高用户体验。
进一步地,在上述任一实施例的基础上,所述方法还包括:
接收拍摄模块拍摄的字体图像;
对所述字体图像进行预处理;
通过预设的待训练字体数据对预设的待训练模型进行训练,获得所述预设的字体识别模型;
将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
在本实施例中,为了实现对字体的识别,可以预先设置一个字体识别模型,对该字体图像进行预处理,获得与处理后的字体图像之后,可以将该处理后的字体图像添加至该字体识别模型中,实现对用户心仪的字体的识别,获得该字体的名称。具体地,为了获取到字体识别模型,首先需要建立待处理模型,卷积神经网络主要包括数据层、卷积层、激活层、池化层、全连接层、分类层等,根据识别的目的和要求的精度将不同层进行组合相连,最终设计一个宽度适当的待处理模型。具体地,首先建立数据层,并将所有输入的图片的尺寸转换为M*M,然后依次设计Inception块,每个Inception块里包括卷积层、激活层、归一化层、池化层等,最后设计全连接层,输出N个结果,并按从大到小的顺序排列。将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
本实施例提供的字体识别方法,通过预设的待训练字体数据对预设的待训练模型进行训练,获得所述预设的字体识别模型,从而为后续的字体识别提供了基础,进而能够提高用户体验。
图3为本发明实施例二提供的字体识别方法的流程示意图,在上述任一实施例的基础上,所述方法包括:
步骤201、接收拍摄模块拍摄的字体图像;
步骤202、对所述字体图像进行预处理;
步骤203、获取预设的待处理数据,所述待处理数据为黑白字体图像;
步骤204、将所述待处理数据随机渲染为彩色图像数据;
步骤205、将所述彩色图像数据随机分为测试集与训练集;
步骤206、分别对所述测试集与所述训练集中的彩色图像数据进行标注,获得所述待训练字体数据;
步骤207、通过预设的待训练字体数据对预设的待训练模型进行训练,获得所述预设的字体识别模型;
步骤208、将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
在本实施例中,为了实现对待训练模型的训练,首先应该获取待训练字体数据。具体地,获取预设的待处理数据,待处理数据为黑白字体图像,举例来说,待处理数据可以为方正家庭字库n款ttf文件生成单字符单图黑白图像。进一步地,为了提高模型的识别精度,可以对待处理数据进行数据增广。可以将黑白图像随机渲染为彩色的RGB图像。进一步地,将彩色图像数据随机分为训练集以及测试集,并对训练集以及测试集中的数据进行标注,获得待训练数据。从而能够根据训练集中的待训练数据对待训练模型进行训练,并通过测试集中的待训练数据中的数据进行测试,最终获得字体识别模型。从而能够根据该字体识别模型对拍摄模块当前拍摄的字体图像进行识别,获得该字体的名称。相应地,获得该字体的名称之后,可以将该字体的名称显示在用户终端的显示屏上,进而用户可以根据该字体名称对字体进行下载以及使用等操作。
本实施例提供的字体识别方法,通过获取预设的待处理数据,所述待处理数据为黑白字体图像;将所述待处理数据随机渲染为彩色图像数据;将所述彩色图像数据随机分为测试集与训练集;分别对所述测试集与所述训练集中的彩色图像数据进行标注,获得所述待训练字体数据,从而能够提高模型的识别精度,进一步地提高用户体验。
进一步地,在上述任一实施例的基础上,所述方法包括:
接收拍摄模块拍摄的字体图像;
对所述字体图像进行预处理;
获取预设的待处理数据,所述待处理数据为黑白字体图像;
将所述待处理数据随机渲染为彩色图像数据;
将所述彩色图像数据随机分为测试集与训练集;
在所述测试集与所述训练集中添加随机噪声以及随机模糊;
针对所述测试集与所述训练集中的每一彩色图像数据,对所述彩色图像数据的字体名称进行标注;
通过预设的待训练字体数据对预设的待训练模型进行训练,获得所述预设的字体识别模型;
将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
在本实施例中,将彩色图像数据随机分为训练集以及测试集之后,需要对训练集以及测试集中的数据进行标注,获得待训练数据。具体地,可以对训练集以及测试集中的待训练数据添加随机模糊以及随机噪音等干扰处理,此外,为了能够使字体识别模型能够精准地实现字体的识别,还需要对测试集以及训练集中的数据进行字体名称的标注。具体地,针对所述测试集与所述训练集中的每一彩色图像数据,对所述彩色图像数据的字体名称进行标注。
本实施例提供的字体识别方法,通过在所述测试集与所述训练集中添加随机噪声以及随机模糊;针对所述测试集与所述训练集中的每一彩色图像数据,对所述彩色图像数据的字体名称进行标注,从而能够使字体识别模型精准地实现对字体的识别,提高用户体验。
进一步地,在上述任一实施例的基础上,所述方法包括:
接收拍摄模块拍摄的字体图像;
对所述字体图像进行预处理;
获取预设的待处理数据,所述待处理数据为黑白字体图像;
将所述待处理数据随机渲染为彩色图像数据;
将所述彩色图像数据随机分为测试集与训练集;
分别对所述测试集与所述训练集中的彩色图像数据进行标注,获得所述待训练字体数据;
通过所述测试集与训练集对所述待训练模型进行训练,对所述待训练模型的超参数进行调整,直至所述待训练模型收敛,获得所述字体识别模型;
将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
在本实施例中,分别对训练集以及测试集中的数据进行标注之后,可以通过训练集以及测试集对待训练模型进行训练。具体地,从而能够根据训练集中的待训练数据对待训练模型进行训练,并通过测试集中的待训练数据中的数据进行测试,并根据训练结果不断调整待训练模型的超参数,其中,超参数包括但不限于学习率、学习策略、遗忘率、最大迭代次数,直至待训练模型收敛,最终获得字体识别模型。
本实施例提供的字体识别方法,通过测试集与训练集对所述待训练模型进行训练,对所述待训练模型的超参数进行调整,直至所述待训练模型收敛,获得所述字体识别模型,从而能够提高字体识别模型的识别精度,进一步地提高用户体验。
进一步地,在上述任一实施例的基础上,所述方法包括:
接收拍摄模块拍摄的字体图像;
计算所述字体识别模型的均值图像;
将所述字体图像减去所述均值图像,获得预处理后的所述字体图像;
将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
在本实施例中,接收到拍摄模块发送的待识别的字体图像,为了提高字体识别的效率以及精度,首先需要对字体图像进行预处理。具体地,可以首先确定字体识别模型的均值图像,并通过拍摄的字体图像减去该均值图像,获得字体图像的特征部分,通过预设的字体识别模型对预处理后的字体图像进行识别,获得该字体的名称。相应地,获得该字体的名称之后,可以将该字体的名称显示在用户终端的显示屏上,进而用户可以根据该字体名称对字体进行下载以及使用等操作。
本实施例提供的字体识别方法,通过计算所述字体识别模型的均值图像;将所述字体图像减去所述均值图像,获得预处理后的所述字体图像,从而能够提高字体识别的效率以及精度,进一步地提高用户体验。
图4为本发明实施例三提供的字体识别装置的结构示意图,如图4所示,所述字体识别装置包括:
字体图像接收模块31,用于接收拍摄模块拍摄的字体图像;
预处理模块32,用于对所述字体文件进行预处理;
识别模块33,用于将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。
在本实施例中,字体识别装置可以通过有线或者无线的方式与拍摄模块进行通信,实现数据交互。具体地,用户在发现自己喜欢的字体的时候,可以通过拍摄模块对该字体进行拍摄,获得该字体的字体图像,并通过有线或者无线的方式将该字体图像发送至字体识别装置。相应地,字体识别装置可以接受拍摄模块发送的字体图像。
作为一种可以实施的方式,该字体图像也可以为用户在通过用户终端浏览某一界面时,对心仪的字体的截图,也可以为其他任意形式获得的字体图像,本发明在此不做限制。
为了提高字体识别的精度,字体识别装置在接收到该字体图像之后,可以对该字体图像进行预处理,获得与处理后的字体图像。
为了实现对字体的识别,可以预先设置一个字体识别模型,对该字体图像进行预处理,获得与处理后的字体图像之后,可以将该处理后的字体图像添加至该字体识别模型中,实现对用户心仪的字体的识别,获得该字体的名称。相应地,获得该字体的名称之后,可以将该字体的名称显示在用户终端的显示屏上,进而用户可以根据该字体名称对字体进行下载以及使用等操作。
本实施例提供的字体识别装置,通过接收拍摄模块拍摄的字体图像;对所述字体文件进行预处理;将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称。从而能够快速地获取到用户喜欢的字体的名称,以使用户根据该字体名称进行字体的下载以及使用,提高用户体验。
进一步地,在上述任一实施例的基础上,所述装置还包括:
训练模块,用于通过预设的待训练字体数据对预设的待训练模型进行训练,获得所述预设的字体识别模型。
本实施例提供的字体识别装置,通过预设的待训练字体数据对预设的待训练模型进行训练,获得所述预设的字体识别模型,从而为后续的字体识别提供了基础,进而能够提高用户体验。
进一步地,在上述任一实施例的基础上,所述装置还包括:
待处理数据获取模块,用于获取预设的待处理数据,所述待处理数据为黑白字体图像;
渲染模块,用于将所述待处理数据随机渲染为彩色图像数据;
分类模块,用于将所述彩色图像数据随机分为测试集与训练集;
标注模块,用于分别对所述测试集与所述训练集中的彩色图像数据进行标注,获得所述待训练字体数据。
本实施例提供的字体识别装置,通过获取预设的待处理数据,所述待处理数据为黑白字体图像;将所述待处理数据随机渲染为彩色图像数据;将所述彩色图像数据随机分为测试集与训练集;分别对所述测试集与所述训练集中的彩色图像数据进行标注,获得所述待训练字体数据,从而能够提高模型的识别精度,进一步地提高用户体验。
进一步地,在上述任一实施例的基础上,所述标注模块包括:
添加单元,用于在所述测试集与所述训练集中添加随机噪声以及随机模糊;
标注单元,用于针对所述测试集与所述训练集中的每一彩色图像数据,对所述彩色图像数据的字体名称进行标注。
本实施例提供的字体识别装置,通过在所述测试集与所述训练集中添加随机噪声以及随机模糊;针对所述测试集与所述训练集中的每一彩色图像数据,对所述彩色图像数据的字体名称进行标注,从而能够使字体识别模型精准地实现对字体的识别,提高用户体验。
进一步地,在上述任一实施例的基础上,所述训练模块,包括:
训练单元,用于通过所述测试集与训练集对所述待训练模型进行训练,对所述待训练模型的超参数进行调整,直至所述待训练模型收敛,获得所述字体识别模型。
本实施例提供的字体识别装置,通过测试集与训练集对所述待训练模型进行训练,对所述待训练模型的超参数进行调整,直至所述待训练模型收敛,获得所述字体识别模型,从而能够提高字体识别模型的识别精度,进一步地提高用户体验。
进一步地,在上述任一实施例的基础上,所述预处理模块包括:
计算单元,用于计算所述字体识别模型的均值图像;
处理单元,用于将所述字体图像减去所述均值图像,获得预处理后的所述字体图像。
本实施例提供的字体识别装置,通过计算所述字体识别模型的均值图像;将所述字体图像减去所述均值图像,获得预处理后的所述字体图像,从而能够提高字体识别的效率以及精度,进一步地提高用户体验。
图5为本发明实施例四提供的字体识别设备的结构示意图,如图5所示,所述字体识别设备包括:
存储器41,处理器42;
存储器41;用于存储所述处理器42可执行指令的存储器41;
其中,所述处理器42被配置为由所述处理器42执行如上述的字体识别方法;
所述字体识别设备还包括通信接口43。
本发明的又一个实施例是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的字体识别方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (4)

1.一种字体识别方法,其特征在于,包括:
接收拍摄模块拍摄的字体图像;
对所述字体图像进行预处理;
将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称;
所述对所述字体图像进行预处理,包括:
计算所述字体识别模型的均值图像;
将所述字体图像减去所述均值图像,获得预处理后的所述字体图像,所述预处理后的字体图像是所述字体图像的特征部分;
所述将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称之前,还包括:
获取预设的待处理数据,所述待处理数据为黑白字体图像;
将所述待处理数据随机渲染为彩色图像数据;
将所述彩色图像数据随机分为测试集与训练集;
在所述测试集与所述训练集中添加随机噪声以及随机模糊;
针对所述测试集与所述训练集中的每一彩色图像数据,对所述彩色图像数据的字体名称进行标注;
通过所述测试集与训练集对待训练模型进行训练,对所述待训练模型的超参数进行调整,直至所述待训练模型收敛,获得所述字体识别模型。
2.一种字体识别装置,其特征在于,包括:
字体图像接收模块,用于接收拍摄模块拍摄的字体图像;
预处理模块,用于对所述字体图像进行预处理;
识别模块,用于将预处理后的所述字体图像添加至预设的字体识别模型中,获得所述字体图像对应的字体名称;
其中,所述预处理模块包括:
计算单元,用于计算所述字体识别模型的均值图像;
处理单元,用于将所述字体图像减去所述均值图像,获得预处理后的所述字体图像,所述预处理后的字体图像是所述字体图像的特征部分;
所述装置还包括:
待处理数据获取模块,用于获取预设的待处理数据,所述待处理数据为黑白字体图像;
渲染模块,用于将所述待处理数据随机渲染为彩色图像数据;
分类模块,用于将所述彩色图像数据随机分为测试集与训练集;
标注模块,用于在所述测试集与所述训练集中添加随机噪声以及随机模糊;
针对所述测试集与所述训练集中的每一彩色图像数据,对所述彩色图像数据的字体名称进行标注;
训练模块,用于通过所述测试集与训练集对待训练模型进行训练,对所述待训练模型的超参数进行调整,直至所述待训练模型收敛,获得所述字体识别模型。
3.一种字体识别设备,其特征在于,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如权利要求1所述的字体识别方法。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1所述的字体识别方法。
CN201811555857.4A 2018-12-19 2018-12-19 字体识别方法、装置、设备及计算机可读存储介质 Active CN111339803B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811555857.4A CN111339803B (zh) 2018-12-19 2018-12-19 字体识别方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811555857.4A CN111339803B (zh) 2018-12-19 2018-12-19 字体识别方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111339803A CN111339803A (zh) 2020-06-26
CN111339803B true CN111339803B (zh) 2023-10-24

Family

ID=71185009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811555857.4A Active CN111339803B (zh) 2018-12-19 2018-12-19 字体识别方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111339803B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188944A (zh) * 1996-12-24 1998-07-29 株式会社理光 字体识别装置、字体识别方法及信息记录媒体
CN101097600A (zh) * 2006-06-29 2008-01-02 北大方正集团有限公司 一种字体识别方法及***
CN102262731A (zh) * 2011-07-11 2011-11-30 哈尔滨工业大学 一种基于稀疏编码的字体识别方法
EP2677461A1 (de) * 2012-06-20 2013-12-25 Audi Ag Informationseinrichtung
CN104200225A (zh) * 2014-08-29 2014-12-10 电子科技大学 一种基于局部空间约束图模型的图像分类方法
CN105117740A (zh) * 2015-08-21 2015-12-02 北京旷视科技有限公司 字体识别方法及装置
US9501724B1 (en) * 2015-06-09 2016-11-22 Adobe Systems Incorporated Font recognition and font similarity learning using a deep neural network
CN106610969A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于多模态信息的视频内容审查***及方法
CN108985297A (zh) * 2018-06-04 2018-12-11 平安科技(深圳)有限公司 手写模型训练、手写图像识别方法、装置、设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3997198B2 (ja) * 2003-12-05 2007-10-24 キヤノン株式会社 画像処理システム及び画像処理方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188944A (zh) * 1996-12-24 1998-07-29 株式会社理光 字体识别装置、字体识别方法及信息记录媒体
CN101097600A (zh) * 2006-06-29 2008-01-02 北大方正集团有限公司 一种字体识别方法及***
CN102262731A (zh) * 2011-07-11 2011-11-30 哈尔滨工业大学 一种基于稀疏编码的字体识别方法
EP2677461A1 (de) * 2012-06-20 2013-12-25 Audi Ag Informationseinrichtung
CN104200225A (zh) * 2014-08-29 2014-12-10 电子科技大学 一种基于局部空间约束图模型的图像分类方法
US9501724B1 (en) * 2015-06-09 2016-11-22 Adobe Systems Incorporated Font recognition and font similarity learning using a deep neural network
CN105117740A (zh) * 2015-08-21 2015-12-02 北京旷视科技有限公司 字体识别方法及装置
CN106610969A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于多模态信息的视频内容审查***及方法
CN108985297A (zh) * 2018-06-04 2018-12-11 平安科技(深圳)有限公司 手写模型训练、手写图像识别方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于CNN网络的汉子图像字体识别;刘志伟;《现代计算机》(第05期);67-70 *
视频检索在汉字识别中的应用研究;桂丹萍;陈佳祥;何红生;;计算机技术与发展(10);全文 *

Also Published As

Publication number Publication date
CN111339803A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN108921782B (zh) 一种图像处理方法、装置及存储介质
CN110930296B (zh) 图像处理方法、装置、设备及存储介质
CN107423306B (zh) 一种图像检索方法及装置
CN111062362B (zh) 人脸活体检测模型、方法、装置、设备及存储介质
CN110705353A (zh) 基于注意力机制的遮挡人脸的识别方法和装置
CN108241855B (zh) 图像生成方法和装置
CN112528318A (zh) 一种图像脱敏的方法、装置及电子设备
CN112001285B (zh) 一种美颜图像的处理方法、装置、终端和介质
CN111401193B (zh) 获取表情识别模型的方法及装置、表情识别方法及装置
CN112802081A (zh) 一种深度检测方法、装置、电子设备及存储介质
CN107274425B (zh) 一种基于脉冲耦合神经网络的彩色图像分割方法及装置
CN113658091A (zh) 一种图像评价方法、存储介质及终端设备
CN117953151A (zh) 基于三维场景的稀疏重建方法和装置
CN111339803B (zh) 字体识别方法、装置、设备及计算机可读存储介质
US11947631B2 (en) Reverse image search based on deep neural network (DNN) model and image-feature detection model
CN110751163A (zh) 目标定位方法及其装置、计算机可读存储介质和电子设备
CN112287932B (zh) 一种确定图像质量的方法、装置、设备及存储介质
CN114004974A (zh) 对弱光环境下拍摄的图像的优化方法及装置
CN114329024A (zh) 一种iconfont图标搜索方法和***
CN113538214A (zh) 一种妆容迁移的控制方法、***和存储介质
CN108446653B (zh) 用于处理面部图像的方法和装置
CN113642415B (zh) 人脸特征表达方法及人脸识别方法
KR102358355B1 (ko) 얼굴 영상의 점진적 디블러링 방법 및 장치
CN110189272B (zh) 用于处理图像的方法、装置、设备和存储介质
CN114677443B (zh) 光学定位方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230703

Address after: 3007, Hengqin International Financial Center Building, No. 58 Huajin Street, Hengqin New District, Zhuhai City, Guangdong Province, 519030

Applicant after: New founder holdings development Co.,Ltd.

Applicant after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 9 floor

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

GR01 Patent grant
GR01 Patent grant