CN111078900B - 一种数据的风险识别方法及*** - Google Patents
一种数据的风险识别方法及*** Download PDFInfo
- Publication number
- CN111078900B CN111078900B CN201911137197.2A CN201911137197A CN111078900B CN 111078900 B CN111078900 B CN 111078900B CN 201911137197 A CN201911137197 A CN 201911137197A CN 111078900 B CN111078900 B CN 111078900B
- Authority
- CN
- China
- Prior art keywords
- data
- identified
- identification
- risk
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
公开了一种数据的风险识别方法及***。一种数据的风险识别方法,该方法包括:任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
Description
技术领域
本说明书实施例涉及互联网应用技术领域,尤其涉及一种数据的风险识别方法及***。
背景技术
随着互联网技术的发展,互联网企业内部通常需要设置多个业务子***,例如设置分别用于处理多个场景业务的多个业务子***,并且不同业务子***各自保存对应场景中产生的数据。因此,当对数据进行风险识别时,现有技术中,需要由各业务子***针对本***中存储的数据,各自进行风险识别与处理,即需要分别维护多个业务子***的风控规则,并且需要分别保证多个业务子***的数据处理时效,这使得互联网企业内部对存在风险的数据进行处理时,维护难度较大,容易出现错误;并且对于不同业务场景中产生的大量重复数据,各业务子***需要单独进行风险识别,效率较低。
发明内容
针对上述技术问题,本说明书实施例提供一种数据的风险识别方法及装置,技术方案如下:
根据本说明书实施例的第一方面,提供一种数据的风险识别方法,应用于包括数据存储服务器、风险识别服务器及至少2个业务子***的***,该方法包括:
任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
在一种可能实现方式中,所述产生待识别数据,包括:
接收用户上传的文字、图片、音频和/或视频数据;
将所述用户上传的数据作为待识别数据。
在一种可能实现方式中,所述向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求,包括:
获取所述待识别数据的关联数据的标识;
基于所述待识别数据的存储位置及所述标识生成风险识别请求;
向所述风险识别服务器发送所述风险识别请求,以便后续根据对所述待识别数据的识别结果处理所述待识别数据及所述关联数据。
在一种可能实现方式中,所述***还包括:风险管理服务器;
所述方法还包括:
所述风险识别服务器向所述风险管理服务器发送风险管理通知,该通知中携带所述待识别数据的存储位置、识别结果和所述关联数据的标识;
所述风险管理服务器根据所述识别结果与预设处理操作的对应关系,确定对所述待识别数据的处理操作。
在一种可能实现方式中,所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,包括:
确定所述待识别数据的数据类型;
基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征。
在一种可能实现方式中,所述数据类型包括视频;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为视频的情况下:
截取所述待识别数据的画面帧,并且基于预设图片识别算法,提取各所述画面帧的待识别特征;和/或,抽取所述待识别数据的音频,并且基于预设音频识别算法,提取所抽取音频的待识别特征。
在一种可能实现方式中,所述数据类型包括音频;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为音频的情况下:
基于预设的发音识别算法判断所述待识别数据的语种及对应语义,得到所述待识别数据的待识别特征;或者,对所述待识别数据进行语音识别得到对应的文字数据,并且基于预设的语义识别算法,提取所述文字数据的待识别特征。
在一种可能实现方式中,所述数据类型包括图片;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为图片的情况下,基于预设图片识别算法,提取所述待识别数据的用于表示图片内容的待识别特征。
在一种可能实现方式中,所述数据类型包括文字;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为文字的情况下,基于预设词库与语义识别算法,提取所述待识别数据的用于表示语义的待识别特征。
根据本说明书实施例的第二方面,提供一种数据的风险识别***,包括数据存储服务器、风险识别服务器及至少2个业务子***,该***具体通过以下方式进行数据的风险识别:
任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
在一种可能实现方式中,任一所述业务子***具体通过以下方式产生待识别数据:
接收用户上传的文字、图片、音频和/或视频数据;
将所述用户上传的数据作为待识别数据。
在一种可能实现方式中,任一所述业务子***具体通过以下方式向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求:
获取所述待识别数据的关联数据的标识;
基于所述待识别数据的存储位置及所述标识生成风险识别请求;
向所述风险识别服务器发送所述风险识别请求,以便后续根据对所述待识别数据的识别结果处理所述待识别数据及所述关联数据。
在一种可能实现方式中,所述***还包括:风险管理服务器;
所述***还具体通过以下方式进行数据的风险识别:
所述风险识别服务器向所述风险管理服务器发送风险管理通知,该通知中携带所述待识别数据的存储位置、识别结果和所述关联数据的标识;
所述风险管理服务器根据所述识别结果与预设处理操作的对应关系,确定对所述待识别数据的处理操作。
在一种可能实现方式中,所述风险识别服务器具体通过以下方式基于统一的预设提取算法,提取所述待识别数据的待识别特征:
确定所述待识别数据的数据类型;
基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征。
在一种可能实现方式中,所述数据类型包括视频;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为视频的情况下:
截取所述待识别数据的画面帧,并且基于预设图片识别算法,提取各所述画面帧的待识别特征;和/或,抽取所述待识别数据的音频,并且基于预设音频识别算法,提取所抽取音频的待识别特征。
在一种可能实现方式中,所述数据类型包括音频;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为音频的情况下:
基于预设的发音识别算法判断所述待识别数据的语种及对应语义,得到所述待识别数据的待识别特征;或者,对所述待识别数据进行语音识别得到对应的文字数据,并且基于预设的语义识别算法,提取所述文字数据的待识别特征。
在一种可能实现方式中,所述数据类型包括图片;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为图片的情况下,基于预设图片识别算法,提取所述待识别数据的用于表示图片内容的待识别特征。
在一种可能实现方式中,所述数据类型包括文字;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为文字的情况下,基于预设词库与语义识别算法,提取所述待识别数据的用于表示语义的待识别特征。
根据本说明书实施例的第二方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如第一方面以及第一方面的可能实现方式中任一项所述的方法。
本说明书实施例所提供的技术方案,将各业务子***产生的数据保存至统一的存储器,并且在产生数据后通知风控服务器获取数据进行风险识别,由风控服务器基于统一的算法对各业务子***产生的数据进行特征提取、风险识别等处理,这样便于企业内部对各业务子***的风控规则的维护,并且针对不同业务场景中产生的重复数据,可以直接获取之前的风险识别结果,而不需要重复进行风险识别。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本说明书实施例的数据的风险识别***的***架构示意图;
图2是本说明书实施例的数据的风险识别方法的第一种流程示意图;
图3是本说明书实施例的数据的风险识别方法的第二种流程示意图;
图4是本说明书实施例的数据的风险识别方法的第三种流程示意图;
图5是本说明书实施例的数据的风险识别方法的第四种流程示意图;
图6是用于配置本说明书实施例装置的一种设备的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。
在本说明书的实施例中,数据的风险识别的流程涉及数据存储服务器、风险识别服务器及至少2个业务子***,对应的***架构示意图如图1所示,包括数据存储服务器10、风险识别服务器20及业务子***30、40等。其中,数据存储服务器、风险识别服务器及业务子***的形式,可以为特定的一台服务器或服务器集群等形式,各设备之间可通过各种形式的网络实现通信连接,本说明书对此并不需要进行限定。
图2为本说明书实施例提供的数据的风险识别方法的交互流程图,具体可以包括以下步骤:
S201,任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
本说明书实施例中,待识别数据可以为预设类型的数据,例如,可以指用户上传的数据、可以指来自***外部的数据、或者可以指***内的全部数据,等等,本说明书实施例对此不做限定,本领域技术人员可以根据实际情况灵活地设置。
在一实施例中,任一业务子***产生待识别数据的过程,可以指接收用户上传的文字、图片、音频和/或视频数据,并且将所述用户上传的数据作为待识别数据。
例如,用户在论坛中发布一条文字评论,则对应业务子***将接收到用户上传的文字数据;又如,用户在社交平台发布一张照片或一段小视频,则对应业务子***将接收到用户上传的图片数据或视频数据;等等。
业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器,这样,***中各业务子***中产生的待识别数据可以统一地存储在数据存储服务器,便于后续统一地进行风险识别与处理。
然后,业务子***向所述风险识别服务器发送风险识别请求,该请求中携带所述待识别数据的存储位置,以便风险识别服务器获取待识别数据进行风险识别。
在一实施例中,待识别数据可能还存在其他关联数据,例如,用户在论坛中发布一条文字评论,则该文字评论为待识别数据,而该用户在短时间内发布的多条评论内容可以为关联数据;又如,商户在购物平台上传了一张商品详情介绍图片,则该图片为待识别数据,而该商品即为关联数据。
本实施例中,业务子***向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求,具体可以首先获取所述待识别数据的关联数据的标识,例如获取用户ID或者商品ID,然后基于所述待识别数据的存储位置及所述标识生成风险识别请求,向所述风险识别服务器发送所述风险识别请求,以便后续根据对所述待识别数据的识别结果处理所述待识别数据及所述关联数据。
S202,所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
风险识别服务器接收到业务子***发送的风险识别请求后,便可以获取该请求中携带的待识别数据的存储位置,由于各子***的待识别数据统一存储在数据存储服务器中,因此可以根据该存储位置直接从数据存储服务器中获取所述待识别数据。
S203,所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
本说明书实施例中,风险识别服务器在确定待识别数据是否存在风险时,首先基于针对各业务子***同一的算法,提取待识别数据的待识别特征。
在一实施例中,风险识别服务器针对不同数据类型的待识别数据,可以设置与采取不同的提取算法。因此可以首先确定所述待识别数据的数据类型,然后基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征。
例如,数据类型可以是视频,视频的实现通常是基于画面帧的连续播放,在待识别数据的类型为视频的情况下,一种方案是截取所述待识别数据的画面帧,并且基于预设图片识别算法,提取各所述画面帧的待识别特征。其中,截帧的频次越高,画面帧的数量越多,则提取到的待识别特征越能够反映视频内容;此外,视频中除了画面还包括音频信息,因此,在待识别数据的类型为视频的情况下,另一种方案是抽取所述待识别数据的音频,并且基于预设音频识别算法,提取所抽取音频的待识别特征。
又如,数据类型可以是音频,则在待识别数据的类型为音频的情况下,一种方案是直接判断音频的语义,即基于预设的发音识别算法判断所述待识别数据的语种及对应语义,得到所述待识别数据的待识别特征;此外,还可以将音频转换为文字后再判断语义,因此另一种方案是对所述待识别数据进行语音识别得到对应的文字数据,并且基于预设的语义识别算法,提取所述文字数据的待识别特征。
再如,数据类型可以是图片,则在待识别数据的类型为图片的情况下,可以基于预设图片识别算法,提取所述待识别数据的用于表示图片内容的待识别特征。
还如,数据类型可以是文字,则在待识别数据的类型为文字的情况下,可以基于预设词库与语义识别算法,提取所述待识别数据的用于表示语义的待识别特征。
针对***中可能存在较多重复数据的情况,可以预先缓存已识别风险的特征的识别结果,然后,在风险识别服务器提取待识别特征后,首先判断预先缓存的若干已识别特征中是否存在所述待识别特征,若存在,则可以直接根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果。
例如,用户在社交平台中上传了一张图片,则风险识别服务器将提取该图片的特征并识别风险,后续该图片可能被其他用户多次转发,则风险识别服务器在提取特征后,如果确定已识别特征中存在该特征,则可以直接根据第一次的识别结果确定对后续各次转发的该图片的识别结果。
本实施例中,也可以限制对已识别特征的缓存量,例如,可以仅为已识别特征分配有限的缓存空间,并在空间存满后删除较早的数据;又如,可以设置老化机制,仅缓存最近一段时间的已识别特征;等等,本领域技术人员可以根据***的实际情况灵活地设置。
在另一实施例中,如步骤S201中所述,待识别数据可能还存在其他关联数据,业务子***可以基于所述待识别数据的存储位置及所述标识生成风险识别请求发送至风险识别服务器。
此外,***中还可以包括风险管理服务器,风险识别服务器得到识别结果后,可以向所述风险管理服务器发送风险管理通知,该通知中携带所述待识别数据的存储位置、识别结果和所述关联数据的标识,所述风险管理服务器根据所述识别结果与预设处理操作的对应关系,确定对所述待识别数据的处理操作。
例如,如果商户在商品界面中上传的图片中,包含涉黄或毒品等违法信息,则可以删除或者屏蔽该图片关联的商品,避免其他用户看到该图片及商品。
为了更清楚地说明本说明书实施例的数据的风险识别方案,下面分别再从单侧的角度,对业务子***与风险识别服务器执行的数据的风险识别方法进行说明:
图3所示为任一业务子***执行的数据的风险识别方法流程图,具体可以包括以下步骤:
S301,在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;
S302,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求。
图4所示为风险识别服务器执行的数据的风险识别方法流程图,具体可以包括以下步骤:
S401,根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
S402,基于统一的预设提取算法,提取所述待识别数据的待识别特征;
S403,判断预先缓存的若干已识别特征中是否存在所述待识别特征;
S404a,若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;
S404b,若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
关于业务子***与风险识别服务器的单侧执行方法细节,可以参见前面实施例的描述,这里不再赘述。
下面结合一个更为具体的实例,对本说明书提供的数据的风险识别方法进行说明。
假设某购物平台的***架构如图5所示,包括商品、店铺、评价及论坛4个业务子***,业务子***中的内容相关信息(图片、音频及视频)集中统一存储在内容服务器上,而不是分散存储在各业务***中。内容存储服务器中可以具体包括图片存储服务器、视频存储服务器及音频存储服务器。此外还设置内容识别引擎与内容集中管控平台。
业务子***在产生一条内容信息(如用户发布一条评论、上传一张照片或发布一个商品的内容等)时,首先会把该条内容上传到内容存储器中,然后会向单独部署的内容识别引擎发送一条内容发布通知,通知中包括内容相关的一些信息以及其在内容存储服务器上的引用地址。
例如,商家发布一张商品图片,则商品业务子***会将其存储到图片存储服务区,然后向内容识别引擎发送通知,通知中包括图片的url地址及对应商品的ID。
内容识别引擎接收到通知后,会从内容存储服务器加载内容信息,并通过其上部署的图片、音频和视频识别算法对内容本身信息进行识别,最终会提取出该条内容相关的特征。
内容识别引擎处理后,会识别结果写入结果通知,再将结果通知发送到内容集中管控平台,内容集中管控平台接收到通知后,可以根据一定条件对这些内容信息进行筛选,例如,内容识别引擎得到的识别结果为打出的分值,则内容集中管控平台可以根据引擎的打分决定如何处置该图片和商品,例如可以直接通知内容存储服务对其进行删除或屏蔽。
可见,应用上述方案,可以将各业务子***产生的数据保存至统一的存储器,并且在产生数据后通知风控服务器获取数据进行风险识别,由风控服务器基于统一的算法对各业务子***产生的数据进行特征提取、风险识别等处理,这样便于企业内部对各业务子***的风控规则的维护。
相应于上述方法实施例,本说明书实施例还提供一种数据的风险识别***,参见图1所示,该***可以包括数据存储服务器、风险识别服务器及至少2个业务子***,该***具体通过以下方式进行数据的风险识别:
任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
在本说明书提供的一种具体实施方式中,任一所述业务子***具体通过以下方式产生待识别数据:
接收用户上传的文字、图片、音频和/或视频数据;
将所述用户上传的数据作为待识别数据。
在本说明书提供的一种具体实施方式中,任一所述业务子***具体通过以下方式向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求:
获取所述待识别数据的关联数据的标识;
基于所述待识别数据的存储位置及所述标识生成风险识别请求;
向所述风险识别服务器发送所述风险识别请求,以便后续根据对所述待识别数据的识别结果处理所述待识别数据及所述关联数据。
在本说明书提供的一种具体实施方式中,所述***还包括:风险管理服务器;
所述***还具体通过以下方式进行数据的风险识别:
所述风险识别服务器向所述风险管理服务器发送风险管理通知,该通知中携带所述待识别数据的存储位置、识别结果和所述关联数据的标识;
所述风险管理服务器根据所述识别结果与预设处理操作的对应关系,确定对所述待识别数据的处理操作。
在本说明书提供的一种具体实施方式中,所述风险识别服务器具体通过以下方式基于统一的预设提取算法,提取所述待识别数据的待识别特征:
确定所述待识别数据的数据类型;
基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征。
在本说明书提供的一种具体实施方式中,所述数据类型包括视频;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为视频的情况下:
截取所述待识别数据的画面帧,并且基于预设图片识别算法,提取各所述画面帧的待识别特征;和/或,抽取所述待识别数据的音频,并且基于预设音频识别算法,提取所抽取音频的待识别特征。
在本说明书提供的一种具体实施方式中,所述数据类型包括音频;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为音频的情况下:
基于预设的发音识别算法判断所述待识别数据的语种及对应语义,得到所述待识别数据的待识别特征;或者,对所述待识别数据进行语音识别得到对应的文字数据,并且基于预设的语义识别算法,提取所述文字数据的待识别特征。
在本说明书提供的一种具体实施方式中,所述数据类型包括图片;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为图片的情况下,基于预设图片识别算法,提取所述待识别数据的用于表示图片内容的待识别特征。
在本说明书提供的一种具体实施方式中,所述数据类型包括文字;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为文字的情况下,基于预设词库与语义识别算法,提取所述待识别数据的用于表示语义的待识别特征。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现前述的数据的风险识别方法。该方法至少包括:
一种数据的风险识别方法,该方法包括:
任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
图6示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作***和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的数据的风险识别方法。该方法至少包括:
一种数据的风险识别方法,该方法包括:
任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。
Claims (17)
1.一种数据的风险识别方法,应用于包括数据存储服务器、风险识别服务器及至少2个业务子***的***,该方法包括:
任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果;
其中,所述向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求,包括:
获取所述待识别数据的关联数据的标识;
基于所述待识别数据的存储位置及所述标识生成风险识别请求;
向所述风险识别服务器发送所述风险识别请求,以便后续根据对所述待识别数据的识别结果处理所述待识别数据及所述关联数据。
2.根据权利要求1所述的方法,所述***还包括:风险管理服务器;
所述方法还包括:
所述风险识别服务器向所述风险管理服务器发送风险管理通知,该通知中携带所述待识别数据的存储位置、识别结果和所述关联数据的标识;
所述风险管理服务器根据所述识别结果与预设处理操作的对应关系,确定对所述待识别数据的处理操作。
3.根据权利要求1所述的方法,所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,包括:
确定所述待识别数据的数据类型;
基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征。
4.根据权利要求3所述的方法,所述数据类型包括视频;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为视频的情况下:
截取所述待识别数据的画面帧,并且基于预设图片识别算法,提取各所述画面帧的待识别特征;和/或,抽取所述待识别数据的音频,并且基于预设音频识别算法,提取所抽取音频的待识别特征。
5.根据权利要求3所述的方法,所述数据类型包括音频;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为音频的情况下:
基于预设的发音识别算法判断所述待识别数据的语种及对应语义,得到所述待识别数据的待识别特征;或者,对所述待识别数据进行语音识别得到对应的文字数据,并且基于预设的语义识别算法,提取所述文字数据的待识别特征。
6.根据权利要求3所述的方法,所述数据类型包括图片;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为图片的情况下,基于预设图片识别算法,提取所述待识别数据的用于表示图片内容的待识别特征。
7.根据权利要求3所述的方法,所述数据类型包括文字;
所述基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征,包括:
在所述数据类型为文字的情况下,基于预设词库与语义识别算法,提取所述待识别数据的用于表示语义的待识别特征。
8.根据权利要求1所述的方法,所述产生待识别数据,包括:
接收用户上传的文字、图片、音频和/或视频数据;
将所述用户上传的数据作为待识别数据。
9.一种数据的风险识别***,包括数据存储服务器、风险识别服务器及至少2个业务子***,该***具体通过以下方式进行数据的风险识别:
任一所述业务子***在产生待识别数据的情况下,将所述待识别数据保存至所述数据存储服务器;并且,向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求;
所述风险识别服务器根据所述存储位置,从所述数据存储服务器中获取所述待识别数据;
所述风险识别服务器基于统一的预设提取算法,提取所述待识别数据的待识别特征,并且判断预先缓存的若干已识别特征中是否存在所述待识别特征;若是,则根据对已识别特征预先缓存的识别结果,确定所述待识别特征的识别结果;若否,则基于统一的预设识别算法确定所述待识别特征的识别结果;
其中,任一所述业务子***具体通过以下方式向所述风险识别服务器发送携带所述待识别数据存储位置的风险识别请求:获取所述待识别数据的关联数据的标识;基于所述待识别数据的存储位置及所述标识生成风险识别请求;向所述风险识别服务器发送所述风险识别请求,以便后续根据对所述待识别数据的识别结果处理所述待识别数据及所述关联数据。
10.根据权利要求9所述的***,任一所述业务子***具体通过以下方式产生待识别数据:
接收用户上传的文字、图片、音频和/或视频数据;
将所述用户上传的数据作为待识别数据。
11.根据权利要求9所述的***,所述***还包括:风险管理服务器;
所述***还具体通过以下方式进行数据的风险识别:
所述风险识别服务器向所述风险管理服务器发送风险管理通知,该通知中携带所述待识别数据的存储位置、识别结果和所述关联数据的标识;
所述风险管理服务器根据所述识别结果与预设处理操作的对应关系,确定对所述待识别数据的处理操作。
12.根据权利要求9所述的***,所述风险识别服务器具体通过以下方式基于统一的预设提取算法,提取所述待识别数据的待识别特征:
确定所述待识别数据的数据类型;
基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征。
13.根据权利要求12所述的***,所述数据类型包括视频;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为视频的情况下:
截取所述待识别数据的画面帧,并且基于预设图片识别算法,提取各所述画面帧的待识别特征;和/或,抽取所述待识别数据的音频,并且基于预设音频识别算法,提取所抽取音频的待识别特征。
14.根据权利要求12所述的***,所述数据类型包括音频;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为音频的情况下:
基于预设的发音识别算法判断所述待识别数据的语种及对应语义,得到所述待识别数据的待识别特征;或者,对所述待识别数据进行语音识别得到对应的文字数据,并且基于预设的语义识别算法,提取所述文字数据的待识别特征。
15.根据权利要求12所述的***,所述数据类型包括图片;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为图片的情况下,基于预设图片识别算法,提取所述待识别数据的用于表示图片内容的待识别特征。
16.根据权利要求12所述的***,所述数据类型包括文字;
所述风险识别服务器具体通过以下方式基于针对所述数据类型的预设提取算法,提取所述待识别数据的待识别特征:
在所述数据类型为文字的情况下,基于预设词库与语义识别算法,提取所述待识别数据的用于表示语义的待识别特征。
17.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911137197.2A CN111078900B (zh) | 2019-11-19 | 2019-11-19 | 一种数据的风险识别方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911137197.2A CN111078900B (zh) | 2019-11-19 | 2019-11-19 | 一种数据的风险识别方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111078900A CN111078900A (zh) | 2020-04-28 |
CN111078900B true CN111078900B (zh) | 2023-10-10 |
Family
ID=70311068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911137197.2A Active CN111078900B (zh) | 2019-11-19 | 2019-11-19 | 一种数据的风险识别方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111078900B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723784B (zh) * | 2020-07-30 | 2024-06-14 | 深圳市雅阅科技有限公司 | 一种风险视频识别方法、装置和电子设备 |
CN112001662B (zh) * | 2020-09-14 | 2022-08-30 | 支付宝(杭州)信息技术有限公司 | 一种商户图像的风险检验方法、装置及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480854A (zh) * | 2017-07-05 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 一种风险识别的方法及装置 |
CN108062674A (zh) * | 2017-12-28 | 2018-05-22 | 上海携程商务有限公司 | 基于gps的订单欺诈识别方法、***、存储介质和电子设备 |
CN109829640A (zh) * | 2019-01-23 | 2019-05-31 | 平安科技(深圳)有限公司 | 企业违约风险的识别方法、装置、计算机设备和存储介质 |
WO2019179256A1 (zh) * | 2018-03-23 | 2019-09-26 | 阿里巴巴集团控股有限公司 | 一种自助购物风控方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10531303B2 (en) * | 2016-04-18 | 2020-01-07 | Blackberry Limited | Detecting and warning of base stations with a security risk |
-
2019
- 2019-11-19 CN CN201911137197.2A patent/CN111078900B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480854A (zh) * | 2017-07-05 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 一种风险识别的方法及装置 |
CN108062674A (zh) * | 2017-12-28 | 2018-05-22 | 上海携程商务有限公司 | 基于gps的订单欺诈识别方法、***、存储介质和电子设备 |
WO2019179256A1 (zh) * | 2018-03-23 | 2019-09-26 | 阿里巴巴集团控股有限公司 | 一种自助购物风控方法及*** |
CN109829640A (zh) * | 2019-01-23 | 2019-05-31 | 平安科技(深圳)有限公司 | 企业违约风险的识别方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
胡水晶 ; .大数据挖掘的隐私风险及应对策略.科技管理研究.2015,(09),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111078900A (zh) | 2020-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6740373B2 (ja) | ページコンポーネント動的レイアウト | |
US9141682B1 (en) | Resolving conflicts within saved state data | |
US8719280B1 (en) | Person-based information aggregation | |
CN109542361B (zh) | 一种分布式存储***文件读取方法、***及相关装置 | |
US9952848B2 (en) | Dependency-aware transformation of multi-function applications for on-demand execution | |
US20170177317A1 (en) | Dependency-Aware Transformation of Multi-Function Applications for On-Demand Execution | |
JP7397094B2 (ja) | リソース構成方法、リソース構成装置、コンピューター機器、及びコンピュータープログラム | |
US20170249934A1 (en) | Electronic device and method for operating the same | |
CN109359118B (zh) | 一种数据写入方法及装置 | |
JP2021103506A (ja) | 情報を生成するための方法及び装置 | |
CN110070593B (zh) | 图片预览信息的显示方法、装置、设备及介质 | |
CN111078900B (zh) | 一种数据的风险识别方法及*** | |
CN107479868B (zh) | 一种界面加载方法、装置及设备 | |
CN111459364B (zh) | 图标更新方法、装置和电子设备 | |
US20140229533A1 (en) | Client-side network page generation | |
CN111596991A (zh) | 交互操作执行方法、装置和电子设备 | |
US20240103928A1 (en) | Information processing method and apparatus for animation resource, device, medium and product | |
CN111381819B (zh) | 列表的创建方法、装置、电子设备及计算机可读存储介质 | |
US10997963B1 (en) | Voice based interaction based on context-based directives | |
CN111104577B (zh) | 数据处理方法、装置、计算机可读存储介质及电子设备 | |
CN111752644A (zh) | 接口模拟方法、装置、设备及存储介质 | |
CN111083145A (zh) | 消息发送方法、装置及电子设备 | |
CN113360127B (zh) | 音频播放方法以及电子设备 | |
CN109710604A (zh) | 数据处理方法、装置、***、计算机可读存储介质 | |
US8615744B2 (en) | Methods and system for managing assets in programming code translation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |