CN111930890A - 信息发送方法、装置、终端设备及存储介质 - Google Patents
信息发送方法、装置、终端设备及存储介质 Download PDFInfo
- Publication number
- CN111930890A CN111930890A CN202010740449.7A CN202010740449A CN111930890A CN 111930890 A CN111930890 A CN 111930890A CN 202010740449 A CN202010740449 A CN 202010740449A CN 111930890 A CN111930890 A CN 111930890A
- Authority
- CN
- China
- Prior art keywords
- information
- sent
- target
- original
- target information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请适用于信息技术领域,提供了一种信息发送方法、装置、终端设备及存储介质,所述方法包括:从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息;计算所述目标信息与所述原始信息之间的莱文斯坦距离;根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度;若所述相似度大于等于预设阈值,则对所述目标信息进行发送。在将待发送信息存储在服务器后,可以采用上述方法在发送时再次对其进行检测,以判断待发送信息是否被篡改,保证实际发送的信息与原始信息一致。
Description
技术领域
本申请属于信息技术领域,尤其涉及一种信息发送方法、装置、终端设备及存储介质。
背景技术
在现有技术中,发送方的信息内容一般由第三方(信息运营方)负责发送,以保证信息的发送速度和到达率。因此,第三方需要对发送方提供的信息内容进行审核,判断是否有不符合规定的内容存在。
通常情况下,第三方在审核信息内容后,会先将审核通过的信息存储在服务器中,然后,根据发送方的发送需求(发送时间)将信息内容发送至目的地址。因此,当审核时间与发送时间存在时间间隔时,发送方可能修改服务器中已审核的信息内容,导致实际发送的信息内容不符合相应的规定,具有较大的风险。
发明内容
本申请实施例提供信息发送方法、装置、终端设备及存储介质,可以解决实际发送的信息内容与审核完成的信息内容不一致的问题。
第一方面,本申请实施例提供了一种信息发送方法,包括:
从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息;
计算所述目标信息与所述原始信息之间的莱文斯坦距离;
根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度;
若所述相似度大于等于预设阈值,则对所述目标信息进行发送。
在一实施例中,在从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息之前,还包括:
获取初始信息并对所述初始信息进行审核,将审核通过的所述初始信息存储至第一服务器,作为待发送的信息;
将审核通过的所述初始信息存储至第二服务器,作为所述待发送的信息对应的原始信息;
根据原始信息的存储位置,生成所述原始信息的索引信息,并建立所述待发送的信息与所述索引信息之间的映射关系。
在一实施例中,所述初始信息还包括待发送时间;
所述从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息,包括:
轮询所述第一服务器中待发送的信息对应的待发送时间;
根据所述待发送时间,从所述待发送的信息中,提取当前时刻下待发送的目标信息。
在一实施例中,所述计算所述目标信息与所述原始信息之间的莱文斯坦距离,包括:
若所述待发送的目标信息与所述原始信息不同,则按预设规则对所述原始信息进行编辑,使编辑后的所述原始信息与所述待发送的目标信息相同,获得多种编辑方式;其中,所述预设规则包括对所述原始信息执行***、删除,和/或替换编辑中的至少一种;
从所述多种编辑方式中确定目标编辑方式;
确定所述目标编辑次数为所述待发送的目标信息与所述原始信息之间的莱文斯坦距离。
在一实施例中,所述从所述多种编辑方式中确定目标编辑方式,包括:
计算每种编辑方式对应的编辑次数;
将所述编辑次数最小的编辑方式,作为目标编辑方式。
在一实施例中,所述根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度,包括:
确定所述待发送的目标信息和所述原始信息的字符长度的最大值;
计算所述莱文斯坦距离与所述字符长度的最大值之间的比值;
根据所述比值计算所述待发送的目标信息和所述原始信息之间的相似度。
在一实施例中,所述信息发送方法还包括:
若所述相似度小于所述预设阈值,则标记当前所述待发送的目标信息,并停止对已标记的目标信息进行发送。
第二方面,本申请实施例提供了一种信息发送装置,包括:
提取模块,用于从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息;
第一计算模块,用于计算所述目标信息与所述原始信息之间的莱文斯坦距离;
第二计算模块,用于根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度;
发送模块,用于若所述相似度大于等于预设阈值,则对所述目标信息进行发送。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的方法。
本申请实施例与现有技术相比存在的有益效果是:通过将发送方第一次提供的初始信息存储至第一服务器,并将该信息同时存储至不可进行编辑的第二服务器中,之后在执行信息发送任务时,可以从第一服务器中提取待发送的目标信息,并从第二服务器中提取目标信息对应的原始信息,计算目标信息与原始信息之间的相似度,并在相似度大于等于预设阈值时,判定目标信息与原始信息内容一致,进而对目标信息进行发送。在将待发送信息存储在服务器后,可以采用上述方法在发送时再次对其进行检测,以判断待发送信息是否被篡改,保证实际发送的信息与原始信息一致。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的信息发送方法的一种流程示意图;
图2是本申请另一实施例提供的信息发送方法的一种流程示意图;
图3是本申请一实施例提供的信息发送方法的S101的一种实现方式示意图;
图4是本申请一实施例提供的信息发送方法的S103的一种实现方式示意图;
图5是本申请一实施例提供的信息发送方法的一种编辑方式示意图;
图6是本申请一实施例提供的信息发送方法的S402的一种实现方式示意图;
图7是本申请一实施例提供的信息发送方法的S103的另一种实现方式示意图;
图8是本申请一实施例提供的信息发送装置的一种结构示意图;
图9是本申请一实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
参照图1,图1示出了本申请实施例提供的信息发送方法的实现流程图,所述方法包括如下步骤:
S101、从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息。
在应用中,上述第一服务器可以是用于存储待发送的目标信息的服务器。目前,现有信息(发送方提供的信息)发送一般通过***(第三方)进行发送。因此,第一服务器可以是第三方搭建的***内的消息发送服务器。
上述第二服务器可以为存储目标信息对应的原始信息的服务器,第二服务器也可以是第三方搭建的存储服务器。
其中,原始信息为发送方初始提供给第三方的信息,待发送的目标信息可以为与原始信息内容一致的信息,也可以为在将原始信息分别存储在第一服务器和第二服务器后,第一服务器中的原始信息经过第三方修改后的信息,对此不作限定。上述待发送的目标信息的信息类型包括但不限于:短信验证码、营销短信、短信通知等类型。
另外,原始信息仅供存储于第二服务器内,发送方无法在第二服务器内对原始信息进行编辑。
在应用中,从第一服务器中提取待发送的目标信息具体可以为,终端设备每隔预设时间从第一服务器中提取已存储的待发送的目标信息;或者,终端设备轮询整个第一服务器,根据待发送的目标信息的发送时间,提取当前时刻下的目标信息。原始信息可以具有对应发送时间的时间信息,在根据发送时间提取待发送的目标信息后,也可对应根据发送时间在第二服务器提取原始信息。当目标信息与原始信息包括多个时,可以根据目标信息的唯一标识与原始信息唯一标识进行匹配。
在应用中,上述待发送的目标信息可以为只包含一种语种的文本,也可以为同时包含不同语种的文本,其中,语种包含但不限于中文、英文等。
S102、计算所述目标信息与所述原始信息之间的莱文斯坦距离。
在应用中,上述莱文斯坦距离(Levenshtein distance)可以用于衡量两个文本之间的相似度。具体的,对于原始信息中的文本,在对其每个字符进行删除、***和/或替换等操作,或者不对其进行任何上述操作。将原始信息执行上述操作变换成目标信息后,其经过的最小变换次数,即可认为是目标信息与原始信息之间的莱文斯坦距离。另外,对于目标信息与原始信息之间的莱文斯坦距离,可对目标信息中的每个字符执行上述操作,变换成原始信息,其经过的最小变换次数与上述对原始信息进行处理的变换次数应是一致的。
S103、根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度。
在应用中,上述相似度可以用于表示目标信息与原始信息的相似程度。其中,上述S102计算出的莱文斯坦距离可在一定程度上初步的体现出目标信息与原始信息的相似程度。在此基础上,可根据莱文斯坦距离进一步计算出目标信息与原始信息的相似度,以便终端设备对其进行准确的判断。
具体的,可在计算出莱文斯坦距离后,计算莱文斯坦距离与原始信息的字符长度或者目标信息的字符长度之间的比值,也可以计算莱文斯坦距离与目标信息和原始信息之间的字符长度的最大值之间的比值。并将该比值与固定值(例如1或者其他数字)做差运算得到相似度。对于当前的原始信息的字符长度或者目标信息的字符长度,其莱文斯坦距离(原始信息或目标信息的变换次数)的数值越大,则上述比值越大,计算得到的相似度越小,即原始信息与目标信息并不相似。
S104、若所述相似度大于等于预设阈值,则对所述目标信息进行发送。
在应用中,上述预设阈值为判断目标信息与原始信息相似度的基准值,具体可视情况而定。在通过S103计算得到的相似度大于等于预设阈值时,即可认为目标信息与原始信息之间所需变换的次数少。因此,可判定目标信息与原始信息相同,或者改动的内容较少,此时可对目标信息进行发送。目标信息的发送地址为接收方的接收地址,可在发送方将目标信息提供至第三方时,同时提供发送地址至第三方。
在一实施例中,上述信息发送方法还包括:若所述相似度小于所述预设阈值,则标记当前所述待发送的目标信息,并停止对已标记的目标信息进行发送。
在应用中,上述S104已说明预设阈值为判断目标信息与原始信息相似度的基准值。因此,在相似度小于预设阈值时,即可认为目标信息与原始信息之间所需变换的次数多。因此,可判定目标信息与原始信息之间的改动较多。此时,可标记当前待发送的目标信息,并停止对已标记的目标信息进行发送。
在本实施例中,在将发送方第一次提供的初始信息存储至第一服务器时,并将该信息同时存储至不可进行编辑的第二服务器中,之后在执行信息发送任务时,可以从第一服务器中提取待发送的目标信息,并从第二服务器中提取目标信息对应的原始信息,计算目标信息与原始信息之间的相似度,并在相似度大于等于预设阈值时,判定目标信息与原始信息内容一致,进而对目标信息进行发送。在将待发送信息存储在服务器后,可以采用上述方法在发送时再次对其进行检测,以判断待发送信息是否被篡改,保证实际发送的信息与原始信息一致。
参照图2,在一实施例中,在S101从第一服务器中提取待发送的目标信息,以及从第二服务器中提取目标信息对应的原始信息之前,还包括如下步骤S201-S203:
S201、获取初始信息并对所述初始信息进行审核,将审核通过的所述初始信息存储至第一服务器,作为待发送的信息。
在应用中,发送方第一次提供给第三方的信息为初始信息。在对该信息进行发送时,第三方可对该信息进行审核。若审核通过,则该初始信息将会存储至第一服务器内;若审核不通过,则该初始信息将被退回至发送方进行修改。其中,在对初始信息进行审核时,审核要求可以是对初始信息的内容进行审核。例如,审核其内容是否包含违法违规内容、是否包含贷款、赌博、毒品等内容,本实施例对此不做限定。
S202、将审核通过的所述初始信息存储至第二服务器,作为所述待发送的信息对应的原始信息。
在应用中,原始信息仅供存储于第二服务器内,发送方无法在第二服务器内对原始信息进行编辑。因此,对于审核通过的初始信息,将其存储在第二服务器后,该信息即为待发送的信息对应的原始信息。
S203、根据原始信息的存储位置,生成所述原始信息的索引信息,并建立所述待发送的信息与所述索引信息之间的映射关系。
在应用中,在将原始信息存储在第二服务器后,为了能够从第二服务器中提取到对应的原始信息,则需要知道原始信息在第二服务器中的存储位置。因此,可根据原始信息的存储位置生成索引信息,并建立索引信息与待发送的信息的映射关系,从而可根据映射关系,由待发送的目标信息查询到在第二服务器中存储的原始信息。
在应用中,上述映射关系可以是单对单映射关系。根据映射关系,可由待发送的信息的索引信息查询到对应的原始信息。上述每个原始信息的索引信息均具有唯一性,以保证在第二服务器中查询到的原始信息的唯一性。其中,索引信息的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。索引信息提供指向原始信息存储在第二服务器中的指定位置,其可使对应于指定位置的相应执行语句(如SQL语句)执行得更快,从而快速访问第二服务器中数据库表的特定信息,该特定信息即为原始信息。
在本实施例中,根据原始信息存储在第二服务器中的存储位置,生成索引信息,并建立索引信息与待发送信息的单对单映射关系,可在从第一服务器中提取出待发送的目标信息后,根据映射关系迅速找到原始信息的索引信息,进而从第二服务器中快速获取到对应的原始信息,根据原始信息达到对目标信息再次审核的目的。
参照图3,在一实施例中,所述初始信息还包括待发送时间;从第一服务器中提取待发送的目标信息可以包括如下子步骤:
S301、轮询所述第一服务器中待发送的信息对应的待发送时间。
S302、根据所述待发送时间,从所述待发送的信息中,提取当前时刻下待发送的目标信息。
在应用中,第三方作为短信发送平台,对于不同客户的不同业务需求,其每天需要发送的信息较多。然而,每个待发送的信息具体发送的内容以及要求,均为发送方提供。第三方为了能够及时发送待发送的信息,则需按照一定的频次或者不间断地遍历短信发送平台中的所有待发送的信息的待发送时间。
在应用中,因待发送的信息较多,其对应的待发送时间也相对较多。因此,为了避免在轮询过程中不能快速查找到所有的待发送信息,短信发送平台可预先将具有相同待发送时间的待发送的信息,进行集中处理生成集合。终端设备可轮询每个集合的待发送时间。在待发送的时间与当前时刻下的时间点一致时,提取当前时刻下待发送的信息即为待发送的目标信息。也即提取该待发送时间对应的集合,该集合内的所有待发送的信息即为待发送的目标信息。
在本实施例中,通过根据发送方提供的待发送时间,第三方的短信发送平台可遍历所有待发送时间,并在待发送时间与当前时间点一致时,提取当前时刻下待发送的信息作为待发送的目标信息进行发送,使得第三方可以及时发送待发送的目标信息。
参照图4,在一实施例中,根据莱文斯坦距离,计算目标信息与原始信息的相似度可以包括如下子步骤S401-S403:
S401、若所述待发送的目标信息与所述原始信息不同,则按预设规则对所述原始信息进行编辑,使编辑后的所述原始信息与所述待发送的目标信息相同,获得多种编辑方式;其中,所述预设规则包括对所述原始信息执行***、删除,和/或替换编辑中的至少一种。
在应用中,若待发送的目标信息与原始信息不同,则表示第三方对发送方提供的初始信息进行审核,并在审核通过将其存储在第一服务器与第二服务器后,发送方可能修改了第一服务器中的待发送的信息。上述对原始信息进行编辑,可以是对原始信息中的目标字符执行了***、删除,和/或替换编辑。其中,目标字符为原始信息中需要进行编辑的字符。
对于原始信息和待发送目标信息中的英文内容可直接进行编辑计算两者之间的莱文斯坦距离;对于原始信息和待发送目标信息中的中文内容,需首先对中文内容进行序列化处理,再进行编辑计算两者之间的莱文斯坦距离。在实际中,英文内容中的单个字母只占半个字符,而一个汉字占一个字符,因此为了方便进行莱文斯坦距离计算,可将单个字母作为一个字符,且一个汉字在进行序列化后,也作为一个字符参与计算。
示例性的,参照图5,对于示例一原始信息为:“sot”,待发送的目标信息为:“stopp”,其第一字符均为“s”,因此,对于“s”字符可不执行上述预设规则操作。之后可在原始内容的“s”与“o”之间***“t”,并将原始信息中原有的第三个字符“t”替换为“p”,并在之后再***一个字母“p”,使生成编辑后的原始信息与待发送的目标信息相同。或者,对于示例二原始信息为:“你的验证码是10001”,待发送的目标信息为:“尊敬的用户你好,你的验证码是10001”,则在分别序列化处理后,得到的内容如下:
原始信息text1={“你”,“的”,“验”,“证”,“码”,“是”,“10001”};
待发送的目标信息text2={“尊”,“敬”,“的”,“用”,“户”,“你”,“好”,“你”,“的”,“验”,“证”,“码”,“是”,“10001”};可知需要执行***编辑7次(“尊”,“敬”,“的”,“用”,“户”,“你”,“好”),所以两者的莱文斯坦距离为7。此时,对于连续的一串数字“10001”,其序列化后归为一个字符,对其进行编辑也可认为是执行一次编辑(执行全部删除编辑或使用待发送的目标信息中的数字内容对其全部进行一次替换编辑)。
在其他应用中,上述预设规则还包括执行交换编辑。示例性的,对于原始信息中包含相邻的两个字符“AB”格式的内容,待发送的目标信息中包含“BA”格式的内容。此时,由原始信息中的AB编辑为待发送的目标信息中的BA的编辑次数为1(交换编辑)而非2(执行两次替换/先执行删除A,再在B之后执行***A)。
在其他应用中,也可对待发送的目标信息进行上述预设规则的编辑,通过使编辑后的待发送的目标信息与原始信息一致来计算二者之间的莱文斯坦距离,本实施例对此不作限定。
S402、从所述多种编辑方式中确定目标编辑方式。
在应用中,上述示例即为一种编辑方式,而对原始信息进行编辑使其与待发送的目标信息一致的编辑方式可以有多种。例如,可将原始信息的内容全部删除,而后逐一添加待发送的目标信息,等等。
此时,对于多种可实现编辑后的原始信息与待发送的目标信息相同的编辑方式,可将多种编辑方式中编辑次数最少的编辑方式作为目标编辑方式。
参照图6,在一实施例中,从多种编辑方式中确定目标编辑方式可以包括如下子步骤S601-S602:
S601、计算每种编辑方式对应的编辑次数。
S602、将所述编辑次数最小的编辑方式,作为目标编辑方式。
在应用中,可认为一次编辑次数即为对原始信息执行一次上述预设规则编辑中的任意一种,进而可计算出每种编辑方式中对应的编辑次数。
在应用中,若编辑次数最少的包括多个编辑方式,例如,对于原始信息中包含相邻的两个字符“AB”格式的内容,待发送的目标信息中包含“BA”格式的内容。此时,对“AB”执行两次替换的编辑次数,与先执行删除A,再在B之后执行***A的编辑次数均一致。因此,可在其中任一选取一种编辑方式作为目标编辑方式。
S403、确定所述目标编辑次数为所述待发送的目标信息与所述原始信息之间的莱文斯坦距离。
在应用中,上述S102已说明其经过最小的变换次数,即可认为是目标信息与原始信息之间的莱文斯坦距离,对此不再详细说明。
在本实施例中,在判断待发送的目标信息与原始信息不同时,判定发送方可能对待发送的目标信息进行过修改。根据预设规则的编辑方式对原始信息进行编辑,使编辑后的原始信息与待发送的目标信息相同时,将对原始信息进行编辑的最少编辑次数,确定为待发送的目标信息与原始信息之间的莱文斯坦距离,以便于更准确地计算两者之间的相似度。
参照图7,在一实施例中,根据莱文斯坦距离,计算目标信息与原始信息的相似度还可以包括如下子步骤S701-S703:
S701、确定所述待发送的目标信息和所述原始信息的字符长度的最大值。
S702、计算所述莱文斯坦距离与所述字符长度的最大值之间的比值。
S703、根据所述比值计算所述待发送的目标信息和所述原始信息之间的相似度。
在应用中,待发送的目标信息在经过发送方修改后,其修改后的目标信息的字符长度与原始信息的字符长度可能一致,也可能不一致。因此,可根据字符长度筛选出待发送的目标信息和原始信息的字符长度的最大值。
然后,根据莱文斯坦距离与字符长度的最大值之间的比值,计算待发送的目标信息和原始信息之间的相似度。具体可为:S=1-d/m,其中,S为相似度,d为莱文斯坦距离,m为待发送的目标信息和原始信息的字符长度的最大值,1为固定值。
因此,对于S401中两个示例,其示例一的相似度S=1-3/5=0.4,其中,3为莱文斯坦距离,5为最大字符长度(待发送的目标信息的字符长度);示例二的相似度S=1-7/14=0.5,其中,7为莱文斯坦距离,14为最大字符长度(待发送的目标信息的字符长度)。
如图8所示,本实施例还提供了一种信息发送装置800,包括:
提取模块810,用于从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息。
第一计算模块820,用于计算所述目标信息与所述原始信息之间的莱文斯坦距离。
第二计算模块830,用于根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度。
发送模块840,用于若所述相似度大于等于预设阈值,则对所述目标信息进行发送。
在一实施例中,信息发送装置800还包括:
获取模块,用于获取初始信息并对所述初始信息进行审核,将审核通过的所述初始信息存储至第一服务器,作为待发送的信息。
存储模块,用于将审核通过的所述初始信息存储至第二服务器,作为所述待发送的信息对应的原始信息。
索引模块,用于根据原始信息的存储位置,生成所述原始信息的索引信息,并建立所述待发送的信息与所述索引信息之间的映射关系。
在一实施例中,所述初始信息还包括待发送时间;提取模块810还用于:
轮询所述第一服务器中待发送的信息对应的待发送时间;
根据所述待发送时间,从所述待发送的信息中,提取当前时刻下待发送的目标信息。
在一实施例中,第一计算模块820还用于:
若所述待发送的目标信息与所述原始信息不同,则按预设规则对所述原始信息进行编辑,使编辑后的所述原始信息与所述待发送的目标信息相同,获得多种编辑方式;其中,所述预设规则包括对所述原始信息执行***、删除,和/或替换编辑中的至少一种;
从所述多种编辑方式中确定目标编辑方式;
确定所述目标编辑次数为所述待发送的目标信息与所述原始信息之间的莱文斯坦距离。
在一实施例中,第一计算模块820还用于:
计算每种编辑方式对应的编辑次数;
将所述编辑次数最小的编辑方式,作为目标编辑方式。
在一实施例中,第一计算模块830还用于:
确定所述待发送的目标信息和所述原始信息的字符长度的最大值;
计算所述莱文斯坦距离与所述字符长度的最大值之间的比值;
根据所述比值计算所述待发送的目标信息和所述原始信息之间的相似度。
在一实施例中,信息发送装置800还包括:
标记模块,用于若所述相似度小于所述预设阈值,则标记当前所述待发送的目标信息,并停止对已标记的目标信息进行发送。
图9是本申请一实施例提供的终端设备90的示意图。如图9所示,该实施例的终端设备90包括:处理器903、存储器901以及存储在所述存储器901中并可在所述处理器903上运行的计算机程序902。所述处理器903执行所述计算机程序902时实现上述各个方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器903执行所述计算机程序902时实现上述各装置实施例中各模块/单元的功能。
示例性的,所述计算机程序902可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器901中,并由所述处理器903执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序902在所述终端设备90中的执行过程。例如,所述计算机程序902可以被分割成提取模块、第一计算模块、第二计算模块和发送模块,各模块具体功能如下:
提取模块,用于从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息。
第一计算模块,用于计算所述目标信息与所述原始信息之间的莱文斯坦距离。
第二计算模块,用于根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度。
发送模块,用于若所述相似度大于等于预设阈值,则对所述目标信息进行发送。
所述终端设备90可以是可穿戴设备,可安装设备。所述终端设备可包括,但不仅限于,处理器903、存储器901。本领域技术人员可以理解,图9仅仅是终端设备90的示例,并不构成对终端设备90的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器903可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器901可以是所述终端设备90的内部存储单元,例如终端设备90的硬盘或内存。所述存储器901也可以是所述终端设备90的外部存储设备,例如所述终端设备90上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。在一个实施例中,所述存储器901还可以既包括所述终端设备90的内部存储单元也包括外部存储设备。所述存储器901用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器901还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时可实现上述各个方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种信息发送方法,其特征在于,包括:
从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息;
计算所述目标信息与所述原始信息之间的莱文斯坦距离;
根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度;
若所述相似度大于等于预设阈值,则对所述目标信息进行发送。
2.如权利要求1所述的信息发送方法,其特征在于,在从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息之前,还包括:
获取初始信息并对所述初始信息进行审核,将审核通过的所述初始信息存储至第一服务器,作为待发送的信息;
将审核通过的所述初始信息存储至第二服务器,作为所述待发送的信息对应的原始信息;
根据原始信息的存储位置,生成所述原始信息的索引信息,并建立所述待发送的信息与所述索引信息之间的映射关系。
3.如权利要求2所述的信息发送方法,其特征在于,所述初始信息还包括待发送时间;
所述从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息,包括:
轮询所述第一服务器中待发送的信息对应的待发送时间;
根据所述待发送时间,从所述待发送的信息中,提取当前时刻下待发送的目标信息。
4.如权利要求1所述的信息发送方法,其特征在于,所述计算所述目标信息与所述原始信息之间的莱文斯坦距离,包括:
若所述待发送的目标信息与所述原始信息不同,则按预设规则对所述原始信息进行编辑,使编辑后的所述原始信息与所述待发送的目标信息相同,获得多种编辑方式;其中,所述预设规则包括对所述原始信息执行***、删除,和/或替换编辑中的至少一种;
从所述多种编辑方式中确定目标编辑方式;
确定所述目标编辑次数为所述待发送的目标信息与所述原始信息之间的莱文斯坦距离。
5.如权利要求4所述的信息发送方法,其特征在于,所述从所述多种编辑方式中确定目标编辑方式,包括:
计算每种编辑方式对应的编辑次数;
将所述编辑次数最小的编辑方式,作为目标编辑方式。
6.如权利要求1所述的信息发送方法,其特征在于,所述根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度,包括:
确定所述待发送的目标信息和所述原始信息的字符长度的最大值;
计算所述莱文斯坦距离与所述字符长度的最大值之间的比值;
根据所述比值计算所述待发送的目标信息和所述原始信息之间的相似度。
7.如权利要求6所述的信息发送方法,其特征在于,还包括:
若所述相似度小于所述预设阈值,则标记当前所述待发送的目标信息,并停止对已标记的目标信息进行发送。
8.一种信息发送装置,其特征在于,包括:
提取模块,用于从第一服务器中提取待发送的目标信息,以及从第二服务器中提取所述目标信息对应的原始信息;
第一计算模块,用于计算所述目标信息与所述原始信息之间的莱文斯坦距离;
第二计算模块,用于根据所述莱文斯坦距离,计算所述目标信息与所述原始信息的相似度;
发送模块,用于若所述相似度大于等于预设阈值,则对所述目标信息进行发送。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010740449.7A CN111930890A (zh) | 2020-07-28 | 2020-07-28 | 信息发送方法、装置、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010740449.7A CN111930890A (zh) | 2020-07-28 | 2020-07-28 | 信息发送方法、装置、终端设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111930890A true CN111930890A (zh) | 2020-11-13 |
Family
ID=73314761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010740449.7A Pending CN111930890A (zh) | 2020-07-28 | 2020-07-28 | 信息发送方法、装置、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111930890A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536786A (zh) * | 2021-06-22 | 2021-10-22 | 深圳价值在线信息科技股份有限公司 | 混淆汉字的生成方法、终端设备及计算机可读存储介质 |
CN114513356A (zh) * | 2022-02-15 | 2022-05-17 | 上海阅维科技股份有限公司 | 一种镜像流量下基于Path相似度的同类型网站发现方法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105320641A (zh) * | 2014-07-30 | 2016-02-10 | 腾讯科技(深圳)有限公司 | 一种文本校验方法及用户终端 |
CN106101144A (zh) * | 2016-08-10 | 2016-11-09 | 山东中磁视讯股份有限公司 | 基于内外网交互的信息收发方法 |
CN106980620A (zh) * | 2016-01-18 | 2017-07-25 | 阿里巴巴集团控股有限公司 | 一种对中文字串进行匹配的方法及装置 |
CN107316239A (zh) * | 2017-07-14 | 2017-11-03 | 众安信息技术服务有限公司 | 一种基于区块链的信息认证和溯源方法及*** |
CN107395574A (zh) * | 2017-06-30 | 2017-11-24 | 上海策赢网络科技有限公司 | 信息标识、信息请求及提供方法和装置、存储介质和设备 |
CN107797990A (zh) * | 2017-10-18 | 2018-03-13 | 渡鸦科技(北京)有限责任公司 | 用于确定文本核心语句的方法和装置 |
CN108596759A (zh) * | 2018-05-09 | 2018-09-28 | 平安普惠企业管理有限公司 | 贷款申请信息检测方法及服务器 |
CN109271641A (zh) * | 2018-11-20 | 2019-01-25 | 武汉斗鱼网络科技有限公司 | 一种文本相似度计算方法、装置及电子设备 |
CN109325349A (zh) * | 2018-08-15 | 2019-02-12 | 深圳市元征科技股份有限公司 | 一种安全管理方法、终端设备及计算机可读存储介质 |
CN109560934A (zh) * | 2018-10-25 | 2019-04-02 | 金蝶软件(中国)有限公司 | 数据防篡改方法、装置、计算机设备和存储介质 |
CN109766508A (zh) * | 2018-12-28 | 2019-05-17 | 广州华多网络科技有限公司 | 信息审核方法、装置及电子设备 |
CN110113168A (zh) * | 2019-04-03 | 2019-08-09 | 厦门历思科技服务有限公司 | 一种信息认证方法、客户端、***及计算机可读存储介质 |
CN110164435A (zh) * | 2019-04-26 | 2019-08-23 | 平安科技(深圳)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
CN111245706A (zh) * | 2020-01-03 | 2020-06-05 | 湖南省梦网科技发展有限公司 | 一种信息处理方法、装置、服务器及介质 |
-
2020
- 2020-07-28 CN CN202010740449.7A patent/CN111930890A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105320641A (zh) * | 2014-07-30 | 2016-02-10 | 腾讯科技(深圳)有限公司 | 一种文本校验方法及用户终端 |
CN106980620A (zh) * | 2016-01-18 | 2017-07-25 | 阿里巴巴集团控股有限公司 | 一种对中文字串进行匹配的方法及装置 |
CN106101144A (zh) * | 2016-08-10 | 2016-11-09 | 山东中磁视讯股份有限公司 | 基于内外网交互的信息收发方法 |
CN107395574A (zh) * | 2017-06-30 | 2017-11-24 | 上海策赢网络科技有限公司 | 信息标识、信息请求及提供方法和装置、存储介质和设备 |
CN107316239A (zh) * | 2017-07-14 | 2017-11-03 | 众安信息技术服务有限公司 | 一种基于区块链的信息认证和溯源方法及*** |
CN107797990A (zh) * | 2017-10-18 | 2018-03-13 | 渡鸦科技(北京)有限责任公司 | 用于确定文本核心语句的方法和装置 |
CN108596759A (zh) * | 2018-05-09 | 2018-09-28 | 平安普惠企业管理有限公司 | 贷款申请信息检测方法及服务器 |
CN109325349A (zh) * | 2018-08-15 | 2019-02-12 | 深圳市元征科技股份有限公司 | 一种安全管理方法、终端设备及计算机可读存储介质 |
CN109560934A (zh) * | 2018-10-25 | 2019-04-02 | 金蝶软件(中国)有限公司 | 数据防篡改方法、装置、计算机设备和存储介质 |
CN109271641A (zh) * | 2018-11-20 | 2019-01-25 | 武汉斗鱼网络科技有限公司 | 一种文本相似度计算方法、装置及电子设备 |
CN109766508A (zh) * | 2018-12-28 | 2019-05-17 | 广州华多网络科技有限公司 | 信息审核方法、装置及电子设备 |
CN110113168A (zh) * | 2019-04-03 | 2019-08-09 | 厦门历思科技服务有限公司 | 一种信息认证方法、客户端、***及计算机可读存储介质 |
CN110164435A (zh) * | 2019-04-26 | 2019-08-23 | 平安科技(深圳)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
CN111245706A (zh) * | 2020-01-03 | 2020-06-05 | 湖南省梦网科技发展有限公司 | 一种信息处理方法、装置、服务器及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536786A (zh) * | 2021-06-22 | 2021-10-22 | 深圳价值在线信息科技股份有限公司 | 混淆汉字的生成方法、终端设备及计算机可读存储介质 |
CN114513356A (zh) * | 2022-02-15 | 2022-05-17 | 上海阅维科技股份有限公司 | 一种镜像流量下基于Path相似度的同类型网站发现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8006180B2 (en) | Spell checking in network browser based applications | |
WO2018036272A1 (zh) | 新闻内容的推送方法、电子装置及计算机可读存储介质 | |
KR101863981B1 (ko) | 텍스트 메시지를 사용하여 스프레드시트와 상호작용하는 기법 | |
CN107085568B (zh) | 一种文本相似度判别方法及装置 | |
CN103810212A (zh) | 一种数据库索引的自动创建方法及*** | |
CN110275965A (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
CN111737443B (zh) | 答案文本的处理方法和装置、关键文本的确定方法 | |
CN111930890A (zh) | 信息发送方法、装置、终端设备及存储介质 | |
CN112307318B (zh) | 一种内容发布方法、***及装置 | |
CN109783589A (zh) | 电子地图解析地址的方法、装置及存储介质 | |
WO2021189766A1 (zh) | 数据可视化方法及相关设备 | |
CN111782728A (zh) | 一种数据同步方法、装置、电子设备及介质 | |
CN106407288B (zh) | 一种信息同步更新的方法及*** | |
CN111179904A (zh) | 混合文语转换方法及装置、终端和计算机可读存储介质 | |
CN111666520A (zh) | 基于表单图像生成电子表单的方法和装置 | |
CN107491530B (zh) | 一种基于文件自动标记信息的社会关系挖掘分析方法 | |
CN112612817B (zh) | 数据处理方法、装置、终端设备及计算机可读存储介质 | |
CN114238475A (zh) | 一种数据仓库的数据处理方法 | |
CN116263770A (zh) | 基于数据库的业务数据存储方法、装置、终端设备及介质 | |
CN114547184A (zh) | 人员信息同步方法、终端设备及存储介质 | |
CN113138974A (zh) | 数据库合规检测的方法和装置 | |
CN109522211B (zh) | 接口参数传递方法、装置、电子设备及存储介质 | |
CN111651531A (zh) | 数据导入方法、装置、设备及计算机存储介质 | |
CN110908663A (zh) | 业务问题的定位方法和定位装置 | |
CN114281981B (zh) | 新闻简报的生成方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |