CN110334702A - 基于配置平台的数据传输方法、装置和计算机设备 - Google Patents
基于配置平台的数据传输方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN110334702A CN110334702A CN201910463920.XA CN201910463920A CN110334702A CN 110334702 A CN110334702 A CN 110334702A CN 201910463920 A CN201910463920 A CN 201910463920A CN 110334702 A CN110334702 A CN 110334702A
- Authority
- CN
- China
- Prior art keywords
- text
- picture
- similarity
- preset
- designated pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
Abstract
本申请揭示了一种基于配置平台的数据传输方法、装置、计算机设备和存储介质,所述方法包括:接收上传终端发送的文字识别申请;利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。从而减少了重复图片对应的文字信息的重复发送导致的额外网络开销。
Description
技术领域
本申请涉及到计算机领域,特别是涉及到一种基于配置平台的数据传输方法、装置、计算机设备和存储介质。
背景技术
将图片中的文字识别出来,是当前生产生活中常使用的技术。传统的文字识别方法是上传终端将包括文字的图片直接上传给识别终端,再由识别终端识别图片以获得识别文字,识别终端再将识别文字发送给上传终端。这种传统方法对于重复图片需要进行重复识别,浪费算力;并且不能实时将识别文字发给第三方终端,而若要将识别文字发给第三方终端,还需要进一步由上传终端将识别文字发给第三方终端,从而多了一步信息发送过程,浪费资源且无法做到实时且同时展示识别文字。
发明内容
本申请的主要目的为提供一种基于配置平台的数据传输方法、装置、计算机设备和存储介质,旨在减少了重复图片对应的文字信息的重复发送导致的额外网络开销。
为了实现上述发明目的,本申请提出一种基于配置平台的数据传输方法,包括以下步骤:
接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;
利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;
若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;
接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;
若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
本申请提供一种基于配置平台的数据传输装置,包括:
文字识别申请接收单元,用于接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;
图片相似度判断单元,用于利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;
指定图片发送单元,用于若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;
图片文字文本接收单元,用于接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;
图片文字文本发送单元,用于若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的基于配置平台的数据传输方法、装置、计算机设备和存储介质,接收上传终端发送的文字识别申请;判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,计算所述图片文字文本与预存文字的相似度值;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。从而减少了重复图片对应的文字信息的重复发送导致的额外网络开销,并且实现了实时展示识别文字。
附图说明
图1为本申请一实施例的基于配置平台的数据传输方法的流程示意图;
图2为本申请一实施例的基于配置平台的数据传输装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种基于配置平台的数据传输方法,包括以下步骤:
S1、接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;
S2、利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;
S3、若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;
S4、接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;
S5、若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
将图片中的文字识别出来,是当前生产生活中常使用的技术。传统的文字识别方法是上传终端将包括文字的图片直接上传给识别终端,再由识别终端识别图片以获得识别文字,识别终端再将识别文字发送给上传终端。这种传统方法对于重复图片需要进行重复识别,浪费算力;并且不能实时将识别文字发给第三方终端,而若要将识别文字发给第三方终端,还需要进一步由上传终端将识别文字发给第三方终端,从而多了一步信息发送过程,浪费资源且无法做到实时且同时展示识别文字。本申请利用配置平台,对数据传递过程进行控制,利用两次相似度计算,以保证将指定图片为新的图片,再将从指定图片识别出的图片文字文本发送给指定的文字展示终端,从而实现了节省算力、节省流程、实时且同时展示识别文字的技术效果。
如上述步骤S1所述,接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片。本申请的执行主体为配置平台,所述配置平台用于在上传终端、识别终端、文字展示终端之间对数据传递过程进行控制,优选为基于大数据技术的配置平台,例如采用大数据引擎spark,采用大数据库HBase等,从而使配置平台能够存储并处理源于大量用户的大量数据。所述上传终端可为任意终端,例如为具有扫描功能的终端、具有拍照功能的终端等,优选为能够进行图像采集从而获得指定图片的终端。其中,所述指定图片为具有文字的图片。
如上述步骤S2所述,利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似。所述预设的图片相似度判断方法例如为:依次对比所述指定图片与预存图片中对应的像素点,若相同的像素点的数量在所有像素点数量中的占比大于预定阈值,则判定所述指定图片与预存图片相似,即表明所述指定图片预先存储在配置平台中,是重复图片,由于预存图片已经采用过文字识别技术识别出文字文本,因此没有必要再进行再一次识别;若相同的像素点的数量在所有像素点数量中的占比不大于预定阈值,则判定所述指定图片与预存图片不相似,表明所述指定图片是新的图片,未采用文字识别技术进行识别,因此需要进行识别。
如上述步骤S3所述,若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。若所述指定图片与预存图片不相似,则所述指定图片有文字识别的需要,因此将所述指定图片发送给指定文本识别终端。本申请采用指定文本识别终端与配置平台相分离的设置,以将文字识别功能单独拆分出来由指定文本识别终端进行识别,可以根据具体的图片采用相应的文字识别算法的识别终端进行识别,实现分级管理、节省资源(简单图片由简单算法识别即可)、便于错误追踪。其中,所述将所述指定图片中的文字内容识别为图片文字文本的技术可采用现有的已成熟识别技术,例如OCR技术(OCR技术是光学字符识别的缩写(Optical Character Recognition),是可用于图像信息转化为可以使用的计算机输入技术),在此不再赘述。
如上述步骤S4所述,接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字。其中,利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值可为任意方法,例如:采用WMD算法(word mover’s distance)、基于余弦相似度、simhash算法、词频向量的算法等以所述图片文字文本与预存文字的相似度值。其中所述相似度阈值可为任意数值,例如为100%,进一步地,为了避免误判,可将相似度阈值设为小于100%,例如为大于等于80%。
如上述步骤S5所述,若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。相似度值用于判断所述图片文字文本与预存文字是否相同,即判断所述指定图片与预存图片是否相同。若所述相似度值不大于预设的相似度阈值,表明所述指定图片是新的图片,因此文字展示终端未保存由所述指定图片识别出的图片文字文本,据此将所述图片文字文本发送给所述文字展示终端,以实时且同时展示识别文字。进一步地,若所述相似度值大于预设的相似度阈值,表明所述指定图片是重复图片,因此文字展示终端保存由所述指定图片识别出的图片文字文本,因此无需发送图片文字文本,只需向所述文字展示终端告知所述图片文字文本存储位置,所述文字展示终端直接调用本地存储数据即可,从而节省了网络开销。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤S2,包括:
S201、分别对所述指定图片与所述预存图片进行灰度化处理,得到第一灰度图片和第二灰度图片;
S202、计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am,以及计算所述灰度图片中所有像素点的灰度值的平均值B;
S203、根据公式:计算所述灰度图片的第m列或者第m行的总体方差其中N为所述灰度图片中的列或者行的总数量;
S204、根据公式:获得两张所述灰度图片的第m列或者第m行的总体方差之差其中,为第一张灰度图片的第m列或者第m行的总体方差,为第二张灰度图片的第m列或者第m行的总体方差;
S205、判断是否小于预设的方差误差阈值;
S206、若小于预设的方差误差阈值,则判定所述指定图片与预存图片相似。
如上所述,实现了利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似。其中,灰度化指将彩色表示一种灰度颜色,例如在在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),从而减少存储量。灰度范围例如为0-255(当R,G,B的取值均为0-255时,当然也会随R,G,B的取值范围的变化而变化)。采用灰度化处理的方法可以为任意方法,例如分量法、最大值法、平均值法、加权平均法等。其中,由于灰度值的取值范围只有256种,在此基础上进行图片对比能够大大减轻计算量。再计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am,以及计算所述灰度图片中所有像素点的灰度值的平均值B。其中,计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am的过程包括:采集所述灰度图片的第m列或者第m行的所有像素点的灰度值,对所述第m列或者第m行的所有像素点的灰度值进行加和处理,将进行过加和处理得到的灰度值之和除以所述第m列或者第m行的所有像素点的数量,得到所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am。计算所述灰度图片中所有像素点的灰度值的平均值B的过程包括:计算所述灰度图片中所有像素点的灰度值之和,再以所述灰度值之和除以所述像素点的数量,得到所述灰度图片中所有像素点的灰度值的平均值B。根据公式:计算所述灰度图片的第m列或者第m行的总体方差其中N为所述灰度图片中的列或者行的总数量。在本申请中,采用总体方差来衡量所述灰度图片的第m列或者第m行的像素点的灰度值的平均值Am与所述灰度图片中所有像素点的灰度值的平均值B之间的差异。
根据公式:获得两张所述灰度图片的第m列或者第m行的总体方差之差其中,为第一张灰度图片的第m列或者第m行的总体方差,为第二张灰度图片的第m列或者第m行的总体方差。总体方差之差反应了两张灰度图片的第m列或者第m行的灰度值的差异。当较小时,例如为0时,表明等于或者近似等于可视为第一张灰度图片第m列或者第m行的灰度值与第二张灰度图片第m列或者第m行的灰度值相同或者近似相同(近似判断,以节省算力,并且由于不同的两张图片的总体方差一般不相等,因此该判断的准确性很高),反之认为第一张灰度图片第m列或者第m行的灰度值与第二张灰度图片第m列或者第m行的灰度值不相同。
判断是否小于预设的方差误差阈值。其中的返回值即为中的最大值。若小于预设的方差误差阈值,则判定所述指定图片与预存图片相似。从而利用了近似判断(由于两张不同图片转化为的灰度图片的所有灰度值一般不相等,而相同图片转化为的灰度图片的所有灰度值一般相等),实现了在消耗较少计算资源的前提下,判断所述指定图片与预存图片是否相似。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤S2,包括:
S201、依次对比所述指定图片与预存图片中对应的像素点,并统计相同像素点的数量;
S202、根据公式:相同像素点占比=所述相同像素点的数量/所述指定图片中所有像素点的数量,计算出所述相同像素点占比;
S203、判断所述相同像素点占比是否大于预设的占比阈值;
S204、若所述相同像素点占比大于预设的占比阈值,则判定所述指定图片与预存图片相似。
如上所述,实现了利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似。为了精准判断所述指定图片与预存图片是否相似,本实施方式采用逐次比对像素点的方式进行判断。若两张图片是相同的,那么相同像素点的数量应当占绝大多数,即所述相同像素点占比趋近于1。据此,根据公式:相同像素点占比=所述相同像素点的数量/所述指定图片中所有像素点的数量,计算出所述相同像素点占比,若所述相同像素点占比大于预设的占比阈值,则判定所述指定图片与预存图片相似。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤S2之后,包括:
S21、若所述指定图片与预存图片相似,则获取所述上传终端对应的所有文字,并根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;
S22、在所述上传终端对应的所有文字中搜索所述预存图片对应的文字文本,从而获取所述预存图片对应的文字文本在所述上传终端对应的所有文字中的位置信息;
S23、将所述位置信息发送给所述文字展示终端。
如上所述,实现了将所述位置信息发送给所述文字展示终端。若所述指定图片与预存图片相似,则只需将预存图片对应的文字文本在所述上传终端对应的所有文字中的位置信息发送给文字展示终端即可,文字展示终端通过所述位置信息即可从本地存储中调取所述上传终端对应的所有文字,并根据所述位置信息获知所述指定图片对应的文字内容。其中,为了适应大数据处理的需要,进一步地,还可以采用Kafka消息队列进行位置信息的传输,即将所述位置信息放入预设的Kafka消息队列,以待文字展示终端进行消费。其中,Kafka是一种高吞吐量的分布式发布订阅消息队列,它可以处理消费者规模的网站中的所有动作流数据。
在一个实施方式中,所述若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本的步骤S3,包括:
S301、若所述指定图片与预存图片不相似,则利用预设的初步文字识别技术识别所述图片文字文本图片中的预定区域,得到初步识别文字,其中预定区域的面积小于所述指定图片的面积;
S302、根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;
S303、对比所述初步识别文字与所述预存图片对应的文字文本,从而判断所述预存图片对应的文字文本是否包含所述初步识别文字;
S304、若所述预存图片对应的文字文本不包含所述初步识别文字,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。
如上所述,实现了在保证少量计算的前提下,进一步确定图片是否相同。本实施方式中,为了防止前述图片判断可能出现的误判,本实施方式采用初步文字识别技术进一步确定指定图片与预存图片是否相似。其中,所述初步文字识别技术可以为任意文字识别技术,例如为OCR识别技术。所述预定区域的面积小于所述指定图片的面积,例如为所述指定图片的边缘区域。由于扫描图片等需要移动摄像头,例如向右平移摄像头,将导致左侧边缘区域与预存图片对应的文字文本不同,从而仅识别左侧边缘区域即可判断所述指定图片与预存图片是否相似。因此本实施方式在仅消耗少量算力的前提下,即可进一步确定指定图片与预存图片是否相似,并且在所述预存图片对应的文字文本不包含所述初步识别文字之时(即所述指定图片与预存图片不相似),则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。
在一个实施方式中,所述接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字的步骤S4,包括:
S401、接收所述指定文本识别终端发送的所述图片文字文本;
S402、采用公式:
计算所述图片文字文本与预存文字的相似度值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;其中similarity为相似度值,A为所述图片文字文本的词频向量,B为所述预存文字的词频向量,Ai为所述图片文字文本的第i个单词出现的次数,Bi为所述预存文字的第i个单词出现的次数;
S403、判断所述相似度值是否大于预设的相似度阈值。
如上所述,实现了计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值。所述词频向量是以文字内容中的各词出现的次数(频率)作为向量的维度数值,所构成的多维向量。即A=(A1,A2,…,An),其中An为最后一个词(共有n个词)的词频。所述相似度算法是根据两个节点的文字内容的余弦相似度进行计算得到,以反应两个节点的文字内容间的相似程度。当similarity的值越接近于1,表明越相似;越接近于0,表明越不相似。据此判断所述相似度值是否大于预设的相似度阈值。其中所述相似度阈值优选为100%。
在一个实施方式中,所述接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字的步骤S4之后,包括:
S41、若所述相似度值大于预设的相似度阈值,则获取所述上传终端对应的所有文字;
S42、获取所述预存文字在所述上传终端对应的所有文字中的位置信息;
S43、将所述位置信息发送给所述文字展示终端。
如上所述,实现了将所述位置信息发送给所述文字展示终端。若所述相似度值大于预设的相似度阈值,表明所述指定图片与预存图片相似(图片文字文本与预存文字相似),因此只需将预存文字在所述上传终端对应的所有文字中的位置信息发送给文字展示终端即可,文字展示终端通过所述位置信息即可从本地存储中调取所述上传终端对应的所有文字,并根据所述位置信息获知所述指定图片对应的文字内容。其中,为了适应大数据处理的需要,进一步地,还可以采用Kafka消息队列进行位置信息的传输,即将所述位置信息放入预设的Kafka消息队列,以待文字展示终端进行消费。其中,Kafka是一种高吞吐量的分布式发布订阅消息队列,它可以处理消费者规模的网站中的所有动作流数据。
在一个实施方式中,所述若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端的步骤S5之前,包括:
S41、获取预定时间内发送至所述文字展示终端的流量值;
S42、判断所述流量值是否大于预设的流量阈值;
S43、若所述流量值大于预设的流量阈值,则通过降低预设的标准阈值的数值的方式获得所述相似度阈值。
如上所述,实现了设置相似度阈值。为了进一步减轻配置平台压力,本申请采用获取预定时间内发送至所述文字展示终端的流量值;判断所述流量值是否大于预设的流量阈值;若所述流量值大于预设的流量阈值,则通过降低预设的标准阈值的数值的方式获得所述相似度阈值的方式,在标准阈值的基础上减小数值,以减少向文字展示终端发送文字文本的次数,进而减轻配置平台压力。
本申请的基于配置平台的数据传输方法,接收上传终端发送的文字识别申请;判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,计算所述图片文字文本与预存文字的相似度值;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。从而减少了重复图片对应的文字信息的重复发送导致的额外网络开销,并且实现了实时展示识别文字。
参照图2,本申请实施例提供一种基于配置平台的数据传输装置,包括:
文字识别申请接收单元10,用于接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;
图片相似度判断单元20,用于利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;
指定图片发送单元30,用于若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;
图片文字文本接收单元40,用于接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;
图片文字文本发送单元50,用于若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
将图片中的文字识别出来,是当前生产生活中常使用的技术。传统的文字识别方法是上传终端将包括文字的图片直接上传给识别终端,再由识别终端识别图片以获得识别文字,识别终端再将识别文字发送给上传终端。这种传统方法对于重复图片需要进行重复识别,浪费算力;并且不能实时将识别文字发给第三方终端,而若要将识别文字发给第三方终端,还需要进一步由上传终端将识别文字发给第三方终端,从而多了一步信息发送过程,浪费资源且无法做到实时且同时展示识别文字。本申请利用配置平台,对数据传递过程进行控制,利用两次相似度计算,以保证将指定图片为新的图片,再将从指定图片识别出的图片文字文本发送给指定的文字展示终端,从而实现了节省算力、节省流程、实时且同时展示识别文字的技术效果。
如上述单元10所述,接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片。本申请的执行主体为配置平台,所述配置平台用于在上传终端、识别终端、文字展示终端之间对数据传递过程进行控制,优选为基于大数据技术的配置平台,例如采用大数据引擎spark,采用大数据库HBase等,从而使配置平台能够存储并处理源于大量用户的大量数据。所述上传终端可为任意终端,例如为具有扫描功能的终端、具有拍照功能的终端等,优选为能够进行图像采集从而获得指定图片的终端。其中,所述指定图片为具有文字的图片。
如上述单元20所述,利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似。所述预设的图片相似度判断方法例如为:依次对比所述指定图片与预存图片中对应的像素点,若相同的像素点的数量在所有像素点数量中的占比大于预定阈值,则判定所述指定图片与预存图片相似,即表明所述指定图片预先存储在配置平台中,是重复图片,由于预存图片已经采用过文字识别技术识别出文字文本,因此没有必要再进行再一次识别;若相同的像素点的数量在所有像素点数量中的占比不大于预定阈值,则判定所述指定图片与预存图片不相似,表明所述指定图片是新的图片,未采用文字识别技术进行识别,因此需要进行识别。
如上述单元30所述,若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。若所述指定图片与预存图片不相似,则所述指定图片有文字识别的需要,因此将所述指定图片发送给指定文本识别终端。本申请采用指定文本识别终端与配置平台相分离的设置,以将文字识别功能单独拆分出来由指定文本识别终端进行识别,可以根据具体的图片采用相应的文字识别算法的识别终端进行识别,实现分级管理、节省资源(简单图片由简单算法识别即可)、便于错误追踪。其中,所述将所述指定图片中的文字内容识别为图片文字文本的技术可采用现有的已成熟识别技术,例如OCR技术(OCR技术是光学字符识别的缩写(Optical Character Recognition),是可用于图像信息转化为可以使用的计算机输入技术),在此不再赘述。
如上述单元40所述,接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字。其中,利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值可为任意方法,例如:采用WMD算法(word mover’s distance)、基于余弦相似度、simhash算法、词频向量的算法等以所述图片文字文本与预存文字的相似度值。其中所述相似度阈值可为任意数值,例如为100%,进一步地,为了避免误判,可将相似度阈值设为小于100%,例如为大于等于80%。
如上述单元50所述,若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。相似度值用于判断所述图片文字文本与预存文字是否相同,即判断所述指定图片与预存图片是否相同。若所述相似度值不大于预设的相似度阈值,表明所述指定图片是新的图片,因此文字展示终端未保存由所述指定图片识别出的图片文字文本,据此将所述图片文字文本发送给所述文字展示终端,以实时且同时展示识别文字。进一步地,若所述相似度值大于预设的相似度阈值,表明所述指定图片是重复图片,因此文字展示终端保存由所述指定图片识别出的图片文字文本,因此无需发送图片文字文本,只需向所述文字展示终端告知所述图片文字文本存储位置,所述文字展示终端直接调用本地存储数据即可,从而节省了网络开销。
在一个实施方式中,所述图片相似度判断单元20,包括:
灰度化处理子单元,用于分别对所述指定图片与所述预存图片进行灰度化处理,得到第一灰度图片和第二灰度图片;
灰度值的平均值计算子单元,用于计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am,以及计算所述灰度图片中所有像素点的灰度值的平均值B;
总体方差获取子单元,用于根据公式:计算所述灰度图片的第m列或者第m行的总体方差其中N为所述灰度图片中的列或者行的总数量;
总体方差之差获取子单元,用于根据公式:获得两张所述灰度图片的第m列或者第m行的总体方差之差其中,为第一张灰度图片的第m列或者第m行的总体方差,为第二张灰度图片的第m列或者第m行的总体方差;
方差误差阈值判断子单元,用于判断是否小于预设的方差误差阈值;
图片相似判定子单元,用于若小于预设的方差误差阈值,则判定所述指定图片与预存图片相似。
如上所述,实现了利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似。其中,灰度化指将彩色表示一种灰度颜色,例如在在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),从而减少存储量。灰度范围例如为0-255(当R,G,B的取值均为0-255时,当然也会随R,G,B的取值范围的变化而变化)。采用灰度化处理的方法可以为任意方法,例如分量法、最大值法、平均值法、加权平均法等。其中,由于灰度值的取值范围只有256种,在此基础上进行图片对比能够大大减轻计算量。再计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am,以及计算所述灰度图片中所有像素点的灰度值的平均值B。其中,计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am的过程包括:采集所述灰度图片的第m列或者第m行的所有像素点的灰度值,对所述第m列或者第m行的所有像素点的灰度值进行加和处理,将进行过加和处理得到的灰度值之和除以所述第m列或者第m行的所有像素点的数量,得到所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am。计算所述灰度图片中所有像素点的灰度值的平均值B的过程包括:计算所述灰度图片中所有像素点的灰度值之和,再以所述灰度值之和除以所述像素点的数量,得到所述灰度图片中所有像素点的灰度值的平均值B。根据公式:计算所述灰度图片的第m列或者第m行的总体方差其中N为所述灰度图片中的列或者行的总数量。在本申请中,采用总体方差来衡量所述灰度图片的第m列或者第m行的像素点的灰度值的平均值Am与所述灰度图片中所有像素点的灰度值的平均值B之间的差异。
根据公式:获得两张所述灰度图片的第m列或者第m行的总体方差之差其中,为第一张灰度图片的第m列或者第m行的总体方差,为第二张灰度图片的第m列或者第m行的总体方差。总体方差之差反应了两张灰度图片的第m列或者第m行的灰度值的差异。当较小时,例如为0时,表明等于或者近似等于可视为第一张灰度图片第m列或者第m行的灰度值与第二张灰度图片第m列或者第m行的灰度值相同或者近似相同(近似判断,以节省算力,并且由于不同的两张图片的总体方差一般不相等,因此该判断的准确性很高),反之认为第一张灰度图片第m列或者第m行的灰度值与第二张灰度图片第m列或者第m行的灰度值不相同。
判断是否小于预设的方差误差阈值。其中的返回值即为中的最大值。若小于预设的方差误差阈值,则判定所述指定图片与预存图片相似。从而利用了近似判断(由于两张不同图片转化为的灰度图片的所有灰度值一般不相等,而相同图片转化为的灰度图片的所有灰度值一般相等),实现了在消耗较少计算资源的前提下,判断所述指定图片与预存图片是否相似。
在一个实施方式中,所述图片相似度判断单元20,包括:
统计相同像素点子单元,用于依次对比所述指定图片与预存图片中对应的像素点,并统计相同像素点的数量;
相同像素点占比计算子单元,用于根据公式:相同像素点占比=所述相同像素点的数量/所述指定图片中所有像素点的数量,计算出所述相同像素点占比;
占比阈值判断子单元,用于判断所述相同像素点占比是否大于预设的占比阈值;
相似判定子单元,用于若所述相同像素点占比大于预设的占比阈值,则判定所述指定图片与预存图片相似。
如上所述,实现了利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似。为了精准判断所述指定图片与预存图片是否相似,本实施方式采用逐次比对像素点的方式进行判断。若两张图片是相同的,那么相同像素点的数量应当占绝大多数,即所述相同像素点占比趋近于1。据此,根据公式:相同像素点占比=所述相同像素点的数量/所述指定图片中所有像素点的数量,计算出所述相同像素点占比,若所述相同像素点占比大于预设的占比阈值,则判定所述指定图片与预存图片相似。
在一个实施方式中,所述装置,包括:
所有文字获取单元,用于若所述指定图片与预存图片相似,则获取所述上传终端对应的所有文字,并根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;
位置信息获取单元,用于在所述上传终端对应的所有文字中搜索所述预存图片对应的文字文本,从而获取所述预存图片对应的文字文本在所述上传终端对应的所有文字中的位置信息;
位置信息发送单元,用于将所述位置信息发送给所述文字展示终端。
如上所述,实现了将所述位置信息发送给所述文字展示终端。若所述指定图片与预存图片相似,则只需将预存图片对应的文字文本在所述上传终端对应的所有文字中的位置信息发送给文字展示终端即可,文字展示终端通过所述位置信息即可从本地存储中调取所述上传终端对应的所有文字,并根据所述位置信息获知所述指定图片对应的文字内容。其中,为了适应大数据处理的需要,进一步地,还可以采用Kafka消息队列进行位置信息的传输,即将所述位置信息放入预设的Kafka消息队列,以待文字展示终端进行消费。其中,Kafka是一种高吞吐量的分布式发布订阅消息队列,它可以处理消费者规模的网站中的所有动作流数据。
在一个实施方式中,所述指定图片发送单元30,包括:
初步识别文字获取子单元,用于若所述指定图片与预存图片不相似,则利用预设的初步文字识别技术识别所述图片文字文本图片中的预定区域,得到初步识别文字,其中预定区域的面积小于所述指定图片的面积;
文字文本获取子单元,用于根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;
初步识别文字判断子单元,用于对比所述初步识别文字与所述预存图片对应的文字文本,从而判断所述预存图片对应的文字文本是否包含所述初步识别文字;
指定图片发送子单元,用于若所述预存图片对应的文字文本不包含所述初步识别文字,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。
如上所述,实现了在保证少量计算的前提下,进一步确定图片是否相同。本实施方式中,为了防止前述图片判断可能出现的误判,本实施方式采用初步文字识别技术进一步确定指定图片与预存图片是否相似。其中,所述初步文字识别技术可以为任意文字识别技术,例如为OCR识别技术。所述预定区域的面积小于所述指定图片的面积,例如为所述指定图片的边缘区域。由于扫描图片等需要移动摄像头,例如向右平移摄像头,将导致左侧边缘区域与预存图片对应的文字文本不同,从而仅识别左侧边缘区域即可判断所述指定图片与预存图片是否相似。因此本实施方式在仅消耗少量算力的前提下,即可进一步确定指定图片与预存图片是否相似,并且在所述预存图片对应的文字文本不包含所述初步识别文字之时(即所述指定图片与预存图片不相似),则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。
在一个实施方式中,所述图片文字文本接收单元40,包括:
图片文字文本接收子单元,用于接收所述指定文本识别终端发送的所述图片文字文本;
相似度值计算子单元,用于采用公式:
计算所述图片文字文本与预存文字的相似度值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;其中similarity为相似度值,A为所述图片文字文本的词频向量,B为所述预存文字的词频向量,Ai为所述图片文字文本的第i个单词出现的次数,Bi为所述预存文字的第i个单词出现的次数;
相似度阈值判断子单元,用于判断所述相似度值是否大于预设的相似度阈值。
如上所述,实现了计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值。所述词频向量是以文字内容中的各词出现的次数(频率)作为向量的维度数值,所构成的多维向量。即A=(A1,A2,…,An),其中An为最后一个词(共有n个词)的词频。所述相似度算法是根据两个节点的文字内容的余弦相似度进行计算得到,以反应两个节点的文字内容间的相似程度。当similarity的值越接近于1,表明越相似;越接近于0,表明越不相似。据此判断所述相似度值是否大于预设的相似度阈值。其中所述相似度阈值优选为100%。
在一个实施方式中,所述装置,包括:
所有文字获取单元,用于若所述相似度值大于预设的相似度阈值,则获取所述上传终端对应的所有文字;
位置信息获取单元,用于获取所述预存文字在所述上传终端对应的所有文字中的位置信息;
位置信息发送单元,用于将所述位置信息发送给所述文字展示终端。
如上所述,实现了将所述位置信息发送给所述文字展示终端。若所述相似度值大于预设的相似度阈值,表明所述指定图片与预存图片相似(图片文字文本与预存文字相似),因此只需将预存文字在所述上传终端对应的所有文字中的位置信息发送给文字展示终端即可,文字展示终端通过所述位置信息即可从本地存储中调取所述上传终端对应的所有文字,并根据所述位置信息获知所述指定图片对应的文字内容。其中,为了适应大数据处理的需要,进一步地,还可以采用Kafka消息队列进行位置信息的传输,即将所述位置信息放入预设的Kafka消息队列,以待文字展示终端进行消费。其中,Kafka是一种高吞吐量的分布式发布订阅消息队列,它可以处理消费者规模的网站中的所有动作流数据。
在一个实施方式中,所述装置,包括:
流量值获取单元,用于获取预定时间内发送至所述文字展示终端的流量值;
流量阈值判断单元,用于判断所述流量值是否大于预设的流量阈值;
相似度阈值获取单元,用于若所述流量值大于预设的流量阈值,则通过降低预设的标准阈值的数值的方式获得所述相似度阈值。
如上所述,实现了设置相似度阈值。为了进一步减轻配置平台压力,本申请采用获取预定时间内发送至所述文字展示终端的流量值;判断所述流量值是否大于预设的流量阈值;若所述流量值大于预设的流量阈值,则通过降低预设的标准阈值的数值的方式获得所述相似度阈值的方式,在标准阈值的基础上减小数值,以减少向文字展示终端发送文字文本的次数,进而减轻配置平台压力。
本申请的基于配置平台的数据传输装置,接收上传终端发送的文字识别申请;判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,计算所述图片文字文本与预存文字的相似度值;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。从而减少了重复图片对应的文字信息的重复发送导致的额外网络开销,并且实现了实时展示识别文字。
参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于配置平台的数据传输方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于配置平台的数据传输方法。
上述处理器执行上述基于配置平台的数据传输方法,包括以下步骤:接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤,包括:分别对所述指定图片与所述预存图片进行灰度化处理,得到第一灰度图片和第二灰度图片;计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am,以及计算所述灰度图片中所有像素点的灰度值的平均值B;根据公式:计算所述灰度图片的第m列或者第m行的总体方差其中N为所述灰度图片中的列或者行的总数量;根据公式:获得两张所述灰度图片的第m列或者第m行的总体方差之差其中,为第一张灰度图片的第m列或者第m行的总体方差,为第二张灰度图片的第m列或者第m行的总体方差;判断是否小于预设的方差误差阈值;若小于预设的方差误差阈值,则判定所述指定图片与预存图片相似。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤,包括:依次对比所述指定图片与预存图片中对应的像素点,并统计相同像素点的数量;根据公式:相同像素点占比=所述相同像素点的数量/所述指定图片中所有像素点的数量,计算出所述相同像素点占比;判断所述相同像素点占比是否大于预设的占比阈值;若所述相同像素点占比大于预设的占比阈值,则判定所述指定图片与预存图片相似。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤之后,包括:若所述指定图片与预存图片相似,则获取所述上传终端对应的所有文字,并根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;在所述上传终端对应的所有文字中搜索所述预存图片对应的文字文本,从而获取所述预存图片对应的文字文本在所述上传终端对应的所有文字中的位置信息;将所述位置信息发送给所述文字展示终端。
在一个实施方式中,所述若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本的步骤,包括:若所述指定图片与预存图片不相似,则利用预设的初步文字识别技术识别所述图片文字文本图片中的预定区域,得到初步识别文字,其中预定区域的面积小于所述指定图片的面积;根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;对比所述初步识别文字与所述预存图片对应的文字文本,从而判断所述预存图片对应的文字文本是否包含所述初步识别文字;若所述预存图片对应的文字文本不包含所述初步识别文字,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。
在一个实施方式中,所述接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字的步骤,包括:接收所述指定文本识别终端发送的所述图片文字文本;采用公式:计算所述图片文字文本与预存文字的相似度值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;其中similarity为相似度值,A为所述图片文字文本的词频向量,B为所述预存文字的词频向量,Ai为所述图片文字文本的第i个单词出现的次数,Bi为所述预存文字的第i个单词出现的次数;判断所述相似度值是否大于预设的相似度阈值。
在一个实施方式中,所述接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字的步骤之后,包括:若所述相似度值大于预设的相似度阈值,则获取所述上传终端对应的所有文字;获取所述预存文字在所述上传终端对应的所有文字中的位置信息;将所述位置信息发送给所述文字展示终端。
在一个实施方式中,所述若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端的步骤之前,包括:获取预定时间内发送至所述文字展示终端的流量值;判断所述流量值是否大于预设的流量阈值;若所述流量值大于预设的流量阈值,则通过降低预设的标准阈值的数值的方式获得所述相似度阈值。
本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请的计算机设备,接收上传终端发送的文字识别申请;判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,计算所述图片文字文本与预存文字的相似度值;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。从而减少了重复图片对应的文字信息的重复发送导致的额外网络开销,并且实现了实时展示识别文字。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于配置平台的数据传输方法,包括以下步骤:接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤,包括:分别对所述指定图片与所述预存图片进行灰度化处理,得到第一灰度图片和第二灰度图片;计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am,以及计算所述灰度图片中所有像素点的灰度值的平均值B;根据公式:计算所述灰度图片的第m列或者第m行的总体方差其中N为所述灰度图片中的列或者行的总数量;根据公式:获得两张所述灰度图片的第m列或者第m行的总体方差之差其中,为第一张灰度图片的第m列或者第m行的总体方差,为第二张灰度图片的第m列或者第m行的总体方差;判断是否小于预设的方差误差阈值;若小于预设的方差误差阈值,则判定所述指定图片与预存图片相似。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤,包括:依次对比所述指定图片与预存图片中对应的像素点,并统计相同像素点的数量;根据公式:相同像素点占比=所述相同像素点的数量/所述指定图片中所有像素点的数量,计算出所述相同像素点占比;判断所述相同像素点占比是否大于预设的占比阈值;若所述相同像素点占比大于预设的占比阈值,则判定所述指定图片与预存图片相似。
在一个实施方式中,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤之后,包括:若所述指定图片与预存图片相似,则获取所述上传终端对应的所有文字,并根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;在所述上传终端对应的所有文字中搜索所述预存图片对应的文字文本,从而获取所述预存图片对应的文字文本在所述上传终端对应的所有文字中的位置信息;将所述位置信息发送给所述文字展示终端。
在一个实施方式中,所述若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本的步骤,包括:若所述指定图片与预存图片不相似,则利用预设的初步文字识别技术识别所述图片文字文本图片中的预定区域,得到初步识别文字,其中预定区域的面积小于所述指定图片的面积;根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;对比所述初步识别文字与所述预存图片对应的文字文本,从而判断所述预存图片对应的文字文本是否包含所述初步识别文字;若所述预存图片对应的文字文本不包含所述初步识别文字,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。
在一个实施方式中,所述接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字的步骤,包括:接收所述指定文本识别终端发送的所述图片文字文本;采用公式:计算所述图片文字文本与预存文字的相似度值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;其中similarity为相似度值,A为所述图片文字文本的词频向量,B为所述预存文字的词频向量,Ai为所述图片文字文本的第i个单词出现的次数,Bi为所述预存文字的第i个单词出现的次数;判断所述相似度值是否大于预设的相似度阈值。
在一个实施方式中,所述接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字的步骤之后,包括:若所述相似度值大于预设的相似度阈值,则获取所述上传终端对应的所有文字;获取所述预存文字在所述上传终端对应的所有文字中的位置信息;将所述位置信息发送给所述文字展示终端。
在一个实施方式中,所述若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端的步骤之前,包括:获取预定时间内发送至所述文字展示终端的流量值;判断所述流量值是否大于预设的流量阈值;若所述流量值大于预设的流量阈值,则通过降低预设的标准阈值的数值的方式获得所述相似度阈值。
本申请的计算机可读存储介质,接收上传终端发送的文字识别申请;判断所述指定图片与预存图片是否相似;若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;接收所述指定文本识别终端发送的所述图片文字文本,计算所述图片文字文本与预存文字的相似度值;若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。从而减少了重复图片对应的文字信息的重复发送导致的额外网络开销,并且实现了实时展示识别文字。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种基于配置平台的数据传输方法,其特征在于,包括:
接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;
利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;
若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;
接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;
若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
2.根据权利要求1所述的基于配置平台的数据传输方法,其特征在于,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤,包括:
分别对所述指定图片与所述预存图片进行灰度化处理,得到第一灰度图片和第二灰度图片;
计算所述灰度图片的第m列或者第m行的所有像素点的灰度值的平均值Am,以及计算所述灰度图片中所有像素点的灰度值的平均值B;
根据公式:计算所述灰度图片的第m列或者第m行的总体方差其中N为所述灰度图片中的列或者行的总数量;
根据公式:获得两张所述灰度图片的第m列或者第m行的总体方差之差其中,为第一张灰度图片的第m列或者第m行的总体方差,为第二张灰度图片的第m列或者第m行的总体方差;
判断是否小于预设的方差误差阈值;
若小于预设的方差误差阈值,则判定所述指定图片与预存图片相似。
3.根据权利要求1所述的基于配置平台的数据传输方法,其特征在于,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤,包括:
依次对比所述指定图片与预存图片中对应的像素点,并统计相同像素点的数量;
根据公式:相同像素点占比=所述相同像素点的数量/所述指定图片中所有像素点的数量,计算出所述相同像素点占比;
判断所述相同像素点占比是否大于预设的占比阈值;
若所述相同像素点占比大于预设的占比阈值,则判定所述指定图片与预存图片相似。
4.根据权利要求1所述的基于配置平台的数据传输方法,其特征在于,所述利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似的步骤之后,包括:
若所述指定图片与预存图片相似,则获取所述上传终端对应的所有文字,并根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;
在所述上传终端对应的所有文字中搜索所述预存图片对应的文字文本,从而获取所述预存图片对应的文字文本在所述上传终端对应的所有文字中的位置信息;
将所述位置信息发送给所述文字展示终端。
5.根据权利要求1所述的基于配置平台的数据传输方法,其特征在于,所述若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本的步骤,包括:
若所述指定图片与预存图片不相似,则利用预设的初步文字识别技术识别所述图片文字文本图片中的预定区域,得到初步识别文字,其中预定区域的面积小于所述指定图片的面积;
根据预设的图片与预存的文字文本的对应关系,获取所述预存图片对应的文字文本;
对比所述初步识别文字与所述预存图片对应的文字文本,从而判断所述预存图片对应的文字文本是否包含所述初步识别文字;
若所述预存图片对应的文字文本不包含所述初步识别文字,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本。
6.根据权利要求1所述的基于配置平台的数据传输方法,其特征在于,所述接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字的步骤,包括:
接收所述指定文本识别终端发送的所述图片文字文本;
采用公式:
计算所述图片文字文本与预存文字的相似度值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;其中similarity为相似度值,A为所述图片文字文本的词频向量,B为所述预存文字的词频向量,Ai为所述图片文字文本的第i个单词出现的次数,Bi为所述预存文字的第i个单词出现的次数;
判断所述相似度值是否大于预设的相似度阈值。
7.根据权利要求1所述的基于配置平台的数据传输方法,其特征在于,所述若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端的步骤之前,包括:
获取预定时间内发送至所述文字展示终端的流量值;
判断所述流量值是否大于预设的流量阈值;
若所述流量值大于预设的流量阈值,则通过降低预设的标准阈值的数值的方式获得所述相似度阈值。
8.一种基于配置平台的数据传输装置,其特征在于,包括:
文字识别申请接收单元,用于接收上传终端发送的文字识别申请,所述文字识别申请指定了文字展示终端,并且所述文字识别申请携带有指定图片;
图片相似度判断单元,用于利用预设的图片相似度判断方法,判断所述指定图片与预存图片是否相似;
指定图片发送单元,用于若所述指定图片与预存图片不相似,则将所述指定图片发送给指定文本识别终端,所述指定文本识别终端用于将所述指定图片中的文字内容识别为图片文字文本;
图片文字文本接收单元,用于接收所述指定文本识别终端发送的所述图片文字文本,并利用预设的文本相似度计算方法,计算所述图片文字文本与预存文字的相似度值,并判断所述相似度值是否大于预设的相似度阈值,其中所述预存文字指通过对所述预存图片进行文字识别而获得的文字;
图片文字文本发送单元,用于若所述相似度值不大于预设的相似度阈值,则将所述图片文字文本发送给所述文字展示终端。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910463920.XA CN110334702B (zh) | 2019-05-30 | 2019-05-30 | 基于配置平台的数据传输方法、装置和计算机设备 |
PCT/CN2020/088049 WO2020238556A1 (zh) | 2019-05-30 | 2020-04-30 | 基于配置平台的数据传输方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910463920.XA CN110334702B (zh) | 2019-05-30 | 2019-05-30 | 基于配置平台的数据传输方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110334702A true CN110334702A (zh) | 2019-10-15 |
CN110334702B CN110334702B (zh) | 2023-04-18 |
Family
ID=68140683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910463920.XA Active CN110334702B (zh) | 2019-05-30 | 2019-05-30 | 基于配置平台的数据传输方法、装置和计算机设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110334702B (zh) |
WO (1) | WO2020238556A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191552A (zh) * | 2019-12-23 | 2020-05-22 | 合肥美的智能科技有限公司 | 基于视觉终端的图像识别方法以及视觉终端 |
CN111339738A (zh) * | 2020-02-27 | 2020-06-26 | 中国平安财产保险股份有限公司 | 包括多色图片的文件的展示方法、装置和计算机设备 |
CN111476279A (zh) * | 2020-03-24 | 2020-07-31 | 平安银行股份有限公司 | 基于相似程度值的识别方法、装置和计算机设备 |
WO2020238556A1 (zh) * | 2019-05-30 | 2020-12-03 | 深圳壹账通智能科技有限公司 | 基于配置平台的数据传输方法、装置和计算机设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033492A (zh) * | 2022-07-06 | 2022-09-09 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种图片上传功能的测试方法及*** |
CN116389227B (zh) * | 2023-03-23 | 2023-11-17 | 江苏锦花电子股份有限公司 | 一种基于物联网的智能预警***及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106325750A (zh) * | 2016-08-26 | 2017-01-11 | 曹蕊 | 一种应用于终端设备的文字识别方法及*** |
CN106469310A (zh) * | 2015-08-17 | 2017-03-01 | 腾讯科技(深圳)有限公司 | 图片中字符提取方法及装置 |
CN107992872A (zh) * | 2017-12-25 | 2018-05-04 | 广东小天才科技有限公司 | 一种对图片进行文本识别的方法及移动终端 |
CN108256523A (zh) * | 2018-01-11 | 2018-07-06 | 上海展扬通信技术有限公司 | 基于移动终端的识别方法、装置及计算机可读存储介质 |
CN108805115A (zh) * | 2018-04-24 | 2018-11-13 | 五八同城信息技术有限公司 | 一种图片中文字的识别方法、装置、设备及存储介质 |
CN109325159A (zh) * | 2018-08-01 | 2019-02-12 | 昆明理工大学 | 一种微博热点事件挖掘方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583438B (zh) * | 2018-10-17 | 2019-11-08 | 龙马智芯(珠海横琴)科技有限公司 | 电子图像的文字的识别方法及图像处理装置 |
CN110334702B (zh) * | 2019-05-30 | 2023-04-18 | 深圳壹账通智能科技有限公司 | 基于配置平台的数据传输方法、装置和计算机设备 |
-
2019
- 2019-05-30 CN CN201910463920.XA patent/CN110334702B/zh active Active
-
2020
- 2020-04-30 WO PCT/CN2020/088049 patent/WO2020238556A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106469310A (zh) * | 2015-08-17 | 2017-03-01 | 腾讯科技(深圳)有限公司 | 图片中字符提取方法及装置 |
CN106325750A (zh) * | 2016-08-26 | 2017-01-11 | 曹蕊 | 一种应用于终端设备的文字识别方法及*** |
CN107992872A (zh) * | 2017-12-25 | 2018-05-04 | 广东小天才科技有限公司 | 一种对图片进行文本识别的方法及移动终端 |
CN108256523A (zh) * | 2018-01-11 | 2018-07-06 | 上海展扬通信技术有限公司 | 基于移动终端的识别方法、装置及计算机可读存储介质 |
CN108805115A (zh) * | 2018-04-24 | 2018-11-13 | 五八同城信息技术有限公司 | 一种图片中文字的识别方法、装置、设备及存储介质 |
CN109325159A (zh) * | 2018-08-01 | 2019-02-12 | 昆明理工大学 | 一种微博热点事件挖掘方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020238556A1 (zh) * | 2019-05-30 | 2020-12-03 | 深圳壹账通智能科技有限公司 | 基于配置平台的数据传输方法、装置和计算机设备 |
CN111191552A (zh) * | 2019-12-23 | 2020-05-22 | 合肥美的智能科技有限公司 | 基于视觉终端的图像识别方法以及视觉终端 |
CN111339738A (zh) * | 2020-02-27 | 2020-06-26 | 中国平安财产保险股份有限公司 | 包括多色图片的文件的展示方法、装置和计算机设备 |
CN111339738B (zh) * | 2020-02-27 | 2024-05-28 | 中国平安财产保险股份有限公司 | 包括多色图片的文件的展示方法、装置和计算机设备 |
CN111476279A (zh) * | 2020-03-24 | 2020-07-31 | 平安银行股份有限公司 | 基于相似程度值的识别方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2020238556A1 (zh) | 2020-12-03 |
CN110334702B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110334702A (zh) | 基于配置平台的数据传输方法、装置和计算机设备 | |
WO2021218180A1 (zh) | 控制车门解锁的方法、装置、车辆、设备、介质及程序 | |
CN110351332A (zh) | 动态调整时间阈值的方法、装置、计算机设备和存储介质 | |
US20200065460A1 (en) | Method and computer readable storage medium for remote interview signature | |
CN110569341A (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
CN110197107B (zh) | 微表情识别方法、装置、计算机设备及存储介质 | |
CN112633146B (zh) | 多姿态人脸性别检测训练优化方法、装置及相关设备 | |
CN109934262A (zh) | 图片差异性判断方法、装置、计算机设备和存储介质 | |
JP7499850B2 (ja) | ネットワーク・サービス・システム、通信用のコンピュータ記憶媒体、およびネットワークサービス方法 | |
CN109087194A (zh) | ***审核方法、装置、计算机设备及存储介质 | |
CN109033139A (zh) | 客户信息查询方法、装置、计算机设备和存储介质 | |
CN108829753A (zh) | 一种信息处理方法及装置 | |
CN111881740B (zh) | 人脸识别方法、装置、电子设备及介质 | |
CN113673439A (zh) | 基于人工智能的宠物狗识别方法、装置、设备及存储介质 | |
CN109343802A (zh) | 保单打印数据生成方法、装置、计算机设备和存储介质 | |
CN110807409A (zh) | 人群密度检测模型训练方法和人群密度检测方法 | |
CN115240262A (zh) | 基于端侧协同人脸识别方法、***、计算机设备及介质 | |
CN112417985A (zh) | 一种人脸特征点追踪方法、***、电子设备和存储介质 | |
CN113905001B (zh) | 一种自动回复方法、装置、计算机设备及可读存储介质 | |
CN110263754B (zh) | 屏下指纹去底纹方法、装置、计算机设备和存储介质 | |
CN108985251A (zh) | 用户指令匹配方法、装置、计算机设备及存储介质 | |
CN113221695B (zh) | 训练肤色识别模型的方法、识别肤色的方法及相关装置 | |
CN105162931A (zh) | 一种通信号码的分类方法及装置 | |
CN117156202A (zh) | 一种ai摄像头的ai算法算力资源调用方法、***及ai摄像头 | |
CN111182117A (zh) | 通话处理方法、装置、计算机设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |