CN109918048B - 目标对象提取方法、装置、***及计算机可读存储介质 - Google Patents

目标对象提取方法、装置、***及计算机可读存储介质 Download PDF

Info

Publication number
CN109918048B
CN109918048B CN201811614035.9A CN201811614035A CN109918048B CN 109918048 B CN109918048 B CN 109918048B CN 201811614035 A CN201811614035 A CN 201811614035A CN 109918048 B CN109918048 B CN 109918048B
Authority
CN
China
Prior art keywords
target object
target
data
category
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811614035.9A
Other languages
English (en)
Other versions
CN109918048A (zh
Inventor
姜丹薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201811614035.9A priority Critical patent/CN109918048B/zh
Publication of CN109918048A publication Critical patent/CN109918048A/zh
Application granted granted Critical
Publication of CN109918048B publication Critical patent/CN109918048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种目标对象提取方法、装置、***及计算机可读存储介质,属于计算机技术领域。其中,终端可以显示包括候选对象类别以及候选特征提取选项的预设界面,接着,可以检测用户对候选对象类别以及候选特征提取选项的选择操作,然后根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,最后,将特征配置信息发送给服务器,服务器会根据特征配置信息提取相匹配的对象。这样,当需要提取符合某种特征的对象时,用户仅需要在预设界面中选择需要提取的对象的类别以及对象需要具备的特征因素即可,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。

Description

目标对象提取方法、装置、***及计算机可读存储介质
技术领域
本发明属于计算机技术领域,特别是涉及一种目标对象提取方法、装置、***及计算机可读存储介质。
背景技术
目前,在安全风控和推荐***中都需要分析用户的行为,提取符合不同特征的对象,例如,符合异常登录特征的用户标识(User identity,UID),用于检测欺诈、识别非法用户、进行个性化推荐,等等。
现有技术中,在需要提取符合某种特征的对象时,往往是针对该对象需要符合的特征,定制化开发相应的实现代码,进而实现对象抓取。但是,现有技术中定制化开发实现代码的方式,耗费的成本较高,实现过程较为繁琐便捷性较低。
发明内容
本发明提供一种目标对象提取方法、装置、***及计算机可读存储介质,以便解决提取目标对象耗费的成本较高,实现过程较为繁琐的问题。
依据本发明的第一方面,提供了一种目标对象提取方法,可以应用于包括终端及服务器的***,该方法可以包括:
所述终端显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项;
所述终端检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
所述终端根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
所述终端将所述特征配置信息发送给服务器;
所述服务器根据所述目标对象的类别以及目标对象所需的特征,提取目标对象。
依据本发明的第二方面,提供了一种目标对象提取方法,可以应用于终端,该方法可以包括:
显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项;
检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
将所述特征配置信息发送给服务器。
可选的,不同的候选特征提取选项对应不同的特征提取因素;
所述根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,包括:
将所选择的候选对象类别确定为目标对象的类别;
将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别,按照预设格式进行组合,得到特征配置信息。
依据本发明的第三方面,提供了一种目标对象提取方法,可以应用于服务器,该方法可以包括:
接收终端发送的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象。
可选的,所述目标对象所需的特征至少包括目标时间段;
所述根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象,包括:
若所述目标对象所需的特征中的目标时间段落入实时数据的时间范围,从实时数据中提取目标对象;或者,
若所述目标对象所需的特征中的目标时间段落入离线数据的时间范围,从离线数据中提取目标对象;或者,
若所述目标对象的特征中的目标时间段的一部分落入所述实时数据的时间范围,且另一部分落入所述离线数据的时间范围,从所述实时数据以及所述离线数据中提取目标对象。
可选的,所述从实时数据中提取目标对象,包括:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
可选的,所述目标对象所需的特征中还包括目标操作的属性;所述从离线数据中提取目标对象,包括:
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
可选的,所述从所述实时数据以及所述离线数据中提取目标对象,包括:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到第一目标对象;
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段、目标操作类型、目标操作的属性,对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到第二目标对象;
将所述第一目标对象及所述第二目标对象作为所述目标对象。
可选的,所述根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象之后,所述方法还包括:
将所述目标对象以及所述目标对象所需的特征存储至指定数据库中。
依据本发明的第四方面,提供了一种目标对象提取***,可以应用于包括终端及服务器的***;
所述终端,用于显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项;
所述终端,还用于检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
所述终端,还用于根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
所述终端,还用于将所述特征配置信息发送给服务器;
所述服务器,还用于根据所述目标对象的类别以及目标对象所需的特征,提取目标对象。
依据本发明的第五方面,提供了一种目标对象提取装置,可以应用于终端,该装置可以包括:
显示模块,用于显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项;
检测模块,用于检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
生成模块,用于根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
发送模块,用于将所述特征配置信息发送给服务器。
可选的,不同的候选特征提取选项对应不同的特征提取因素;
所述生成模块,用于:
将所选择的候选对象类别确定为目标对象的类别;
将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别,按照预设格式进行组合,得到特征配置信息。
依据本发明的第六方面,提供了一种目标对象提取装置,可以应用于终端,该装置可以包括:
接收模块,用于接收终端发送的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
提取模块,用于根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象。
可选的,所述目标对象所需的特征至少包括目标时间段;
所述提取模块,包括:
第一提取子模块,用于若所述目标对象所需的特征中的目标时间段落入实时数据的时间范围,从实时数据中提取目标对象;或者,
第二提取子模块,用于若所述目标对象所需的特征中的目标时间段落入离线数据的时间范围,从离线数据中提取目标对象;或者,
第三提取子模块,用于若所述目标对象的特征中的目标时间段的一部分落入所述实时数据的时间范围,且另一部分落入所述离线数据的时间范围,从所述实时数据以及所述离线数据中提取目标对象。
可选的,所述第一提取子模块,用于:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
可选的,所述目标对象所需的特征中还包括目标操作的属性;所述第二提取子模块,用于:
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
可选的,所述第三提取子模块,用于:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到第一目标对象;
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段、目标操作类型、目标操作的属性,对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到第二目标对象;
将所述第一目标对象及所述第二目标对象作为所述目标对象。
可选的,所述装置还包括:
存储模块,用于将所述目标对象以及所述目标对象所需的特征存储至指定数据库中。
依据本发明的第七方面,提供了一种计算机可读存储介质,,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面、第二方面以及第三方面所述的目标对象提取方法。
针对在先技术,本发明具备如下优点:终端显示包括候选对象类别以及候选特征提取选项的预设界面,接着,可以检测用户对预设界面中候选对象类别以及候选特征提取选项的选择操作,然后根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,其中,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,最后,将特征配置信息发送给服务器,服务器会根据特征配置信息提取相匹配的对象。这样,当需要提取符合某种特征的对象时,用户仅需要在预设界面中选择需要提取的对象的类别以及对象需要具备的特征因素即可,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种目标对象提取方法的步骤流程图;
图2是本发明实施例提供的另一种目标对象提取方法的步骤流程图;
图3是本发明实施例提供的又一种目标对象提取方法的步骤流程图;
图4-1是本发明实施例提供的再一种目标对象提取方法的步骤流程图;
图4-2是本发明实施例提供的一种用户界面示意图;
图4-3是本发明实施例提供的一种数据筛选界面示意图;
图4-4是本发明实施例提供的一种目标特征提取方法的应用示意图;
图5是本发明实施例提供的一种目标对象提取***的框图;
图6是本发明实施例提供的一种目标对象提取装置的框图;
图7是本发明实施例提供的另一种目标对象提取装置的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实际的应用场景中,例如,安全风控场景、物品推荐场景中,经常需要分析用户的行为,以分析结果作为依据来确定存在高危行为的用户,或者,确定用户可能感兴趣的物品或不感兴趣的物品,等等。进一步地,在分析用户的行为时,往往是根据实际需求,提取具备相应特征对象,例如,在需要确定用户是否存在高危行为时,需要提取具备高危行为特征的UID,在需要向用户推荐用户可能感兴趣的物品时,需要提取具备高频次访问特征的物品的IP地址,相应地,现有技术中,往往是针对一个特征提取需求,定制化的开发一套代码,通过开发的这套代码,实现对象提取,整个操作较为繁琐,成本较高。
因此,本发明实施例提供一种目标对象提取方法,在该方法中,针对现有技术所存在的操作较为繁琐,成本较高的问题,提供了相应的解决思路:由终端显示预设界面,该预设界面可以是预先开发的,该界面中可以包括预设的候选对象类别以及候选特征提取选项,终端可以检测用户对候选对象类别以及候选特征提取选项的选择操作,并根据用户所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,接着,将该特征配置信息发送给服务器,服务器会根据特征配置信息提取相匹配的对象,这样,用户仅需根据自己的提取需求,在预设界面中进行选择,即可通过服务器实现提取具备相应特征的对象,进而简化了操作过程,降低了实现成本。
下面对上述提到的目标对象提取方法进行具体描述。
图1是本发明实施例提供的一种目标对象提取方法的步骤流程图,应用于包括终端及服务器的***,如图1所示,该方法可以包括:
步骤101、所述终端显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项。
本发明实施例中,该预设界面可以是开发人员预先开发的,该预设界面中可以定义有不同的候选对象类别以及不同的候选特征提取选项,其中,预设界面中定义的候选对象类别指示不同种类的对象,示例的,该对象类别可以是用户身份标识(user identity,UID),指纹、网页的IP地址,等等。进一步地,不同的候选特征提取选项可以对应不同的特征提取因素,特征提取因素可以作为所需提取的特征中的部分内容。进一步地,实际应用中,可以在预设界面中显示所有特征提取因素的所有可选内容,以供用户选择,当然,也可以在预设界面中显示所有特征提取因素对应的定义输入框,用户可以手动输入所需的内容,本发明实施例对此不做限定。
步骤102、所述终端检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作。
实际应用中,用户进行选择操作时,往往是根据自己的实际需要进行选择的,因此,本步骤中,终端可以检测用户对预设界面中候选对象类别以及候选特征提取选项的选择操作,以此确定用户需要提取具备什么特征的对象。
步骤103、所述终端根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征。
相应地,本发明实施例中,终端可以根据所选择的候选对象类别,确定目标对象的类别,根据所选择的候选特征提取选项,确定目标对象所需的特征,最后,生成定义有目标对象的类别以及所需特征的特征配置信息。
步骤104、所述终端将所述特征配置信息发送给服务器。
本发明实施例中,由于特征配置信息中定义有目标对象的类别以及所需的特征的特征配置信息,因此,终端可以将特征配置信息发送给服务器,服务器根据该特征配置信息即可提取具备所需的特征的目标对象。
步骤105、所述服务器根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象。
本发明实施例中,服务器可以接收该特征配置信息,然后从中获取目标对象的类别以及目标对象所需的特征,其中,目标对象的类别可以指示需要要提取何种对象,目标对象所需的特征可以指示所提取的对象需要具备的特征,接着,从网络***中提取具备目标对象所需的特征的对象,得到目标对象。
综上所述,本发明实施例提供的目标对象提取方法,终端可以显示包括候选对象类别以及候选特征提取选项的预设界面,接着,可以检测用户对候选对象类别以及候选特征提取选项的选择操作,然后根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,其中,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,最后,将特征配置信息发送给服务器,服务器会根据特征配置信息提取相匹配的对象。这样,当需要提取符合某种特征的对象时,用户仅需要在预设界面中选择需要提取的对象的类别以及对象需要具备的特征因素即可,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
图2是本发明实施例提供的另一种目标对象提取方法的步骤流程图,应用于终端,如图2所示,该方法可以包括:
步骤201、显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项。
具体的,本步骤的实现方式可以参考上述步骤101,本发明实施例在此不做赘述。
步骤202、检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作。
具体的,本步骤的实现方式可以参考上述步骤102,本发明实施例在此不做赘述。
步骤203、根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征。
具体的,本步骤的实现方式可以参考上述步骤103,本发明实施例在此不做赘述。
步骤204、将所述特征配置信息发送给服务器,以使所述服务器根据所述特征配置信息提取相匹配的对象。
具体的,本步骤的实现方式可以参考上述步骤104,本发明实施例在此不做赘述。
综上所述,本发明实施例提供的目标对象提取方法,终端可以显示包括候选对象类别以及候选特征提取选项的预设界面,接着,可以检测用户对候选对象类别以及候选特征提取选项的选择操作,然后根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,其中,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,最后,将特征配置信息发送给服务器,以使服务器会根据特征配置信息提取相匹配的对象。这样,当需要提取符合某种特征的对象时,用户仅需要在预设界面中选择需要提取的对象的类别以及对象需要具备的特征因素即可,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
图3是本发明实施例提供的又一种目标对象提取方法的步骤流程图,应用于服务器,如图所示,该方法可以包括:
步骤301、接收终端发送的特征配置信息;所述特征配置信息是所述终端根据用户在预设界面上的选择操作生成的,所述特征配置信息至少定义目标对象的类别以及目标对象所需的特征。
具体的,本步骤的实现方式可以参考上述步骤105,本发明实施例在此不做赘述。
步骤302、根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象。
具体的,本步骤的实现方式可以参考上述步骤105,本发明实施例在此不做赘述。
综上所述,本发明实施例提供的目标对象提取方法,服务器可以接收终端发送的特征配置信息,其中,该特征配置信息是终端根据用户在预设界面上的选择操作生成的,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,然后根据特征配置信息中的目标对象的类别以及目标对象所需的特征,提取目标对象。这样,当需要提取符合某种特征的对象时,用户仅需要在终端的预设界面中选择需要提取的对象的类别以及对象需要具备的特征因素,终端会基于用户的选择生成特征配置信息,并发送给服务器,进行对象提取,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
图4-1是本发明实施例提供的再一种目标对象提取方法的步骤流程图,如图4-1所示,该方法可以包括:
步骤401、终端显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项。
本步骤中,不同的候选特征提取选项可以对应不同的特征提取因素,该特征提取因素可以包括时间范围、操作的属性、比较符以及比较值,等等。其中,时间范围可以是不限时间,也可以是固定时间段,例如,11月10日至11月20日,也可以是滑动时间段,即,时间段的长度固定,但起止时间点一直在向前滚动,例如,距离当前时间点2小时内,进一步地,操作的属性可以是操作的实际次数、单位时间内的最大值次数、单位时间内的最小值次数、单位时间内的最新值次数、去重计数(DISTINCT COUNT)的次数、操作的持续时长、等等,进一步地,比较符可以包括大于、大于等于、小于、小于等于、等于,等等,比较值可以是任一数值。
示例的,图4-2是本发明实施例提供的一种用户界面示意图,如图4-2所示,图4-2中以“特征模式”表示操作的属性,具体的,图4-2中以用户选择的操作的属性为“单位时间内的最新值次数”为例,进行示意。进一步地,实际应用中,用户可能会选择多个候选对象类别,即,可能会存在多个目标对象的类别,因此,图4-2中以“维度组合”表示用户所选择的候选对象类别,具体的,图4-2中以用户选择的候选对象类别为“IP”以及“UID”为例,进行示意。
进一步地,预设界面还可以包括“去重维度”选项,用户可以将选择的多个候选对象类别中的任一候选对象类别作为去重维度,以控制服务器根据除作为去重维度的候选对象类别之外的其他的候选对象类别进行对象提取,图4-2中以去重维度为“IP”为例,进行示意。进一步地,实际应用中,目标对象所需的特征中可能会包含表示实体对象的内容,例如,目标对象所需的特征可以为登录操作对应的登录账号的数量大于3,那么,该登录账号即为表示实体对象的内容,因此,预设界面中还可以包括“添加”选项以及“清除”选项,用户可以通过选择“添加”选项,增加“下沉维度”,其中,下沉维度中可以设定目标对象所需的特征中包含的实体对象,例如,登录账号,这样,通过设定下沉维度,可以控制服务器显示提取到的目标对象对应的特征中包含的实体对象。具体的,图4-2中以下沉维度为“登录账号”为例,进行示意。进一步地,该界面中以“时间窗口”定义时间范围,图4-2中以时间范围为滑动时间段为例,设定时间范围为距离当前时间点的1分钟至10分钟,该界面中还包括“阈值”,即,比较值,图4-2中以阈值等于5为例,进行示意性说明。当然,实际应用中,该界面中还可以包括其他内容,例如,比较符的选择区域,等等,本发明实施例对此不作限定。
步骤402、终端检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作。
具体的,本步骤的实现方式可以参考上述步骤102,本发明实施例在此不做赘述。
步骤403、终端根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征。
本步骤中,终端可以通过下述子步骤(1)~子步骤(2)实现:
子步骤(1):将所选择的候选对象类别确定为目标对象的类别。
示例的,假设用户所选择的候选对象类别为UID,则终端可以确定目标对象的类别为UID。
子步骤(2):将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别,按照预设格式进行组合,得到特征配置信息。
本步骤中,目标对象所需的特征即为需要提取的对象所需具备的特征,进一步地,该预设格式可以开发人员预先定义的,本发明实施例对此不做限定。示例的,该预设格式可以为“目标对象的类别+目标操作的属性+比较符+比较值”。相应地,终端可以按照该预设格式中目标对象的类别以及每个特征提取因素的顺序,对用户所选择的目标对象的类别以及特征提取因素进行组合,进而得到特征配置信息。示例的,假设用户选择的目标对象的类别为UID,选择的特征提取选项对应的特征提取因素为1分钟、登录操作的次数、大于、5,那么通过组合可以得到特征配置信息为:UID+1分钟+登录操作的次数+大于+5,其中,特征提取因素组成的部分“1分钟+登录操作的次数+大于+5”用于表示目标所需的特征,该特征配置信息可以用于指示服务器提取1分钟内登录操作的次数大于5次的UID。
步骤404、终端将所述特征配置信息发送给服务器。
具体的,本步骤的实现方式可以参考上述步骤104,本发明实施例在此不做赘述。
步骤405、服务器接收终端发送的特征配置信息。
具体的,本步骤的实现方式可以参考上述步骤105,本发明实施例在此不做赘述。
步骤406、服务器根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象。
本步骤中,目标对象所需的特征可以至少包括目标时间段,该目标时间段即为生成特征配置信息时所使用的特征提取因素中包括的时间范围。进一步地,网络***中的数据包括实时数据以及离线数据,其中,实时数据为服务器在距离当前时刻的预设时长内接收到的实时数据,该预设时长是根据实际情况设定的,示例的,该预设时长可以为10分钟,离线数据为服务器距离当前时刻的超出预设时长的时间内接收到的历史数据,进一步地,离线数据可以存在数据库中,该数据库可以部署在该服务器上,也可以部署在其他服务器上,本发明实施例对此不做限定。
相应地,若目标对象所需的特征中目标时间段落入实时数据的时间范围,服务器可以从实时数据中提取目标对象。其中,实时数据的时间范围即为距离当前时刻的预设时长内,本发明实施例中,通过在目标对象所需的特征中目标时间段落入实时数据的时间范围,从实时数据中提取目标对象,可以缩小提取范围,进而提高提取效率。
具体的,服务器可以通过下述子步骤(1)来实现从实时数据中提取目标对象的步骤:
子步骤(1):利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到目标对象。
本步骤中,该实时计算引擎可以是预先部署在服务器上的用于从实时数据中提取对象的引擎,该实时数据可以由多个消息队列构成,每个消息队列中可以包括发送给服务器的数据,该数据可以为日志。
具体的,在提取目标对象时,可以先对实时数据中的每条数据进行分析,确定每条数据所指示的对象、对该对象进行的操作以及操作时间,接着,对分析结果进行统计,确定与目标对象的类别相同的对象在目标时间段内对应的目标操作的属性的具体值,最后,判断其是否满足特征配置信息中比较符及比较值所表示的数值关系,例如,通过统计得到UID1在距离当前时间点的1分钟内的登录次数为3,UID2在距离当前时间点的1分钟内的登录次数为7,而特征配置信息中比较符及比较值所表示的数值关系为大于5,由于UID1不满足该数值关系,而UID2满足该数值关系,则可以将UID2确定为目标对象。
进一步地,若目标对象所需的特征中目标时间段落入离线数据的时间范围,服务器可以从离线数据中提取目标对象,其中,离线数据的时间范围即为距离当前时刻的预设时长之外的时间,本发明实施例中,通过在目标对象所需的特征中目标时间段落入离线数据的时间范围,从离线数据中提取目标对象,可以缩小提取范围,进而提高提取效率。
具体的,服务器可以通过下述子步骤(1)至子步骤(3)来实现从离线数据中提取目标对象的步骤:
子步骤(1):根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据。
实际应用中,为了便于离线数据的管理,离线数据往往会按照不同的数据维度进行分类存储至不同的位置,因此,会存在多个数据源。以数据维度为数据对应的操作的类型为例,该预设的多个数据源中可以存储针对不同类型的操作的离线数据,其中,每个数据源的地址以及采用的数据格式不同。
相应地,本步骤中,可以从预设的多个数据源中,选择存储的离线数据为针对目标操作的类型的数据源,作为目标数据源,进而缩小提取对象的数据范围,提高提取操作的效率。其中,目标操作的类型用于指示目标操作具体为何种操作。示例的,假设目标操作的类型为登录操作,那么服务器可以选择存储的离线数据为针对登录操作的数据源作为目标数据源。
子步骤(2):根据所述目标对象所需的特征中包括的目标时间段对所述目标数据源中的数据进行筛选,得到待分析离线数据。
示例的,假设目标时间段为11月10号至11月20号,那么服务器根据目标数据源中每条离线数据的时间点进行筛选,具体的,可以将时间点在11月10号至11月20号内的离线数据确定为待分析离线数据。当然,随着对象提取的需求不同,目标对象所需的特征中还可以包括其他信息,例如,数据的业务来源,相应地,在进行筛选时,还可以根据业务来源进行筛选,在具备多个筛选条件时候,可以以每个条件都满足作为筛选标准,也可以以满足其中任一条件为筛选标准,本发明实施例对此不做限定。本发明实施例中,通过对目标数据源中的离线数据进行筛选,可以进一步缩小提取对象的数据范围,进一步提高提取操作的效率。
进一步地,为了提高数据筛选的灵活性,本发明实施例中,可以由用户设定数据筛选的条件,相应地,服务器可以以用户设定的内容为依据,执行相应的筛选操作。示例的,图4-3是本发明实施例提供的一种数据筛选界面示意图,具体的,服务器可以通过外接的显示设备,例如,通过与服务器连接的终端显示该界面,用户可以在该界面设定数据筛选条件,如图4-3所示,该界面中包括两个筛选模式选项:“满足以下所有条件”以及“满足以下任意条件”,具体的,图4-3以用户选择了“满足以下所有条件”为例,进行示意性说明,相应地,如果用户选择了选项“满足以下所有条件”,那么服务器可以以每个条件都满足作为筛选标准,如果用户选择了选项“满足以下任意条件”,那么服务器可以以满足其中任一条件为筛选标准,进一步地,该界面中还包括“添加”选项以及“清空”选项,用户可以通过点击“添加”选项添加筛选条件,通过点击清空”选项将添加的筛选条件删除,图4-3中以用户添加了3个筛选条件,这3个筛选条件分别为:“业务名称等于security_slide_captcha”、“Level等于3”以及“滑动验证码滑动验证结果等于true”为例,进行示意性说明。
子步骤(3):利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到目标对象。
本步骤中,该离线计算引擎可以是预先部署在服务器上的用于从离线数据中提取对象的引擎。具体的,在提取目标对象时,可以先对待分析离线数据中的每条待分析离线数据进行分析,确定每条待分析离线数据所指示的对象、对该对象进行的操作以及操作时间,接着,对分析结果进行统计,确定与目标对象的类别相同的对象在目标时间段内对应的目标操作的属性的次数,最后,判断其是否满足特征配置信息中比较符及比较值所表示的数值关系。
进一步地,若目标对象所需的特征中目标时间段落入离线数据的时间范围,服务器可以从离线数据中提取目标对象,其中,离线数据的时间范围即为距离当前时刻的预设时长之外的时间,本发明实施例中,通过在目标对象所需的特征中目标时间段落入离线数据的时间范围,从离线数据中提取目标对象,可以缩小提取范围,进而提高提取效率。
进一步地,若目标对象所需的特征中的目标时间段的一部分落入实时数据的时间范围,且另一部分落入离线数据的时间范围,从实时数据以及离线数据中提取目标对象。具体的,服务器可以通过下述子步骤(1)来实现从实时数据中提取目标对象的步骤:
子步骤(1):利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到第一目标对象。
示例的,假设目标对象所需的特征中目标时间段为一分钟,那么服务器可以从实时数据中统计与目标对象的类别相同的对象在一分钟内的对应的目标操作的属性的具体值,例如统计UID在1分钟内对应的登录次数的具体值,最后,判断其是否满足特征配置信息中比较符及比较值所表示的数值关系,如果满足,则将其确定为第一目标对象。
子步骤(2):根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据。
具体的,本步骤的实现方式可以参考前述子步骤,本发明实施例在此不做赘述。
子步骤(3)根据所述目标对象所需的特征中包括的目标时间段对所述目标数据源中的数据进行筛选,得到待分析离线数据。
具体的,本步骤的实现方式可以参考前述子步骤,本发明实施例在此不做赘述。需要说明的是,实际应用中,为了提高对实时数据的分析效率,也可以先对实时数据进行筛选,最后,从筛选后的实时数据中提取目标对象,进而提高提取操作的效率。
子步骤(4):利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到第二目标对象。
示例的,服务器可以利用预设的离线计算引擎,从待分析离线数据中统计与目标对象的类别相同的对象在一分钟内的对应的目标操作的属性的具体值,接着,判断其是否满足特征配置信息中比较符及比较值所表示的数值关系,如果满足,则将其确定为第二目标对象。本发明实施例中,通过为实时数据以及离线数据分别设置不同的计算引擎,可以实现同时从实时数据及离线数据中提取对象,进而保证了对象提取的效率。
子步骤(5):将所述第一目标对象及所述第二目标对象作为目标对象。
示例的,服务器可以将第一目标对象及第二目标对象构成的集合中的所有对象,确定为目标对象。
需要说明的是,实际应用中,在提取目标对象时,也可以参考第三方数据,例如,其他网络***提供的日志,以此提高提取的目标对象的代表性,示例的,图4-4是本发明实施例提供的一种目标特征提取方法的应用示意图,如图4-4所示,实时数据可以包括多个消息队列:消息队列1,...,消息队列X,离线数据可以包括多个数据源:数据仓库1,...,数据仓库Y、服务器可以利用实时计算引擎以及离线计算引擎对实时数据及离线数据进行处理,具体的,可以先对数据进行筛选,然后以目标对象所需的特征为依据,从筛选后的数据中提取目标对象。
进一步地,为了便于后续过程中,对根据目标对象所具备的特征对目标对象进行利用,本发明实施例中,服务器还可以在根据目标对象的类别以及目标对象所需的特征,提取目标对象之后,将所述目标对象以及目标对象所需的特征,存储至指定数据库中,以便于其他操作进行利用。示例的,可以将目标对象以及目标对象所需的特征作为模型训练样本,用于训练模型,或者,根据目标对象以及目标对象所需的特征,为客户端设置访问规则,例如,假目标对象所需的特征为一分钟内登录操作的大于10次,可以设置访问规则为禁止具备该目标对象所需的特征的目标对象访问,以提高客户端的安全性。
综上所述,本发明实施例提供的目标对象提取方法,终端可以显示包括候选对象类别以及候选特征提取选项的预设界面,接着,可以检测用户对候选对象类别以及候选特征提取选项的选择操作,然后根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,其中,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,最后,将特征配置信息发送给服务器,服务器会根据特征配置信息提取相匹配的对象。这样,当需要提取符合某种特征的对象时,用户仅需要在预设界面中选择需要提取的对象的类别以及对象需要具备的特征因素即可,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
图5是本发明实施例提供的一种目标对象提取***的框图,如图5所示,该***50可以包括:终端501及服务器502;
所述终端501,用于显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项;
所述终端501,还用于检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
所述终端501,还用于根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
所述终端501,还用于将所述特征配置信息发送给服务器502;
所述服务器502,用于根据所述目标对象的类别以及目标对象所需的特征,提取目标对象。
综上所述,本发明实施例提供的一种目标对象提取***,终端可以显示包括候选对象类别以及候选特征提取选项的预设界面,接着,可以检测用户对候选对象类别以及候选特征提取选项的选择操作,然后根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,其中,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,最后,将特征配置信息发送给服务器,服务器会根据特征配置信息提取相匹配的对象。这样,当需要提取符合某种特征的对象时,用户仅需要在预设界面中选择需要提取的对象类别以及对象需要具备的特征因素即可,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
图6是本发明实施例提供的一种目标对象提取装置的框图,如图6所示,该装置60可以包括:
显示模块601,用于显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项;
检测模块602,用于检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
生成模块603,用于根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
发送模块604,用于将所述特征配置信息发送给服务器,以使所述服务器根据所述特征配置信息提取相匹配的对象。
可选的,不同的候选特征提取选项对应不同的特征提取因素;
所述生成模块603,用于:
将所选择的候选对象类别确定为目标对象的类别;
将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别,按照预设格式进行组合,得到特征配置信息。
综上所述,本发明实施例提供的一种目标对象提取装置,显示模块可以显示包括候选对象类别以及候选特征提取选项的预设界面,检测模块可以检测用户对预设界面中候选对象类别以及候选特征提取选项的选择操作,然后生成模块可以根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,其中,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,最后,发送模块可以将特征配置信息发送给服务器,以使服务器会根据特征配置信息提取相匹配的对象。这样,当需要提取符合某种特征的对象时,用户仅需要在预设界面中选择需要提取的对象类别以及对象需要具备的特征因素即可,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
图7是本发明实施例提供的另一种目标对象提取装置的框图,如图7所示,该装置70可以包括:
接收模块701,用于接收终端发送的特征配置信息;所述特征配置信息是所述终端根据用户在预设界面上的选择操作生成的,所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;
提取模块702,用于根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象。
可选的,所述目标对象所需的特征至少包括目标时间段;
所述提取模块702,包括:
第一提取子模块,用于若所述目标对象所需的特征中的目标时间段落入实时数据的时间范围,从实时数据中提取目标对象;或者,
第二提取子模块,用于若所述目标对象所需的特征中的目标时间段落入离线数据的时间范围,从离线数据中提取目标对象;或者,
第三提取子模块,用于若所述目标对象的特征中的目标时间段的一部分落入所述实时数据的时间范围,且另一部分落入所述离线数据的时间范围,从所述实时数据以及所述离线数据中提取目标对象
可选的,所述第一提取子模块,用于:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到目标对象。
可选的,所述目标对象所需的特征中还包括目标操作的属性;所述第二提取子模块,用于:
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到目标对象。
可选的,所述第三提取子模块,用于:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到第一目标对象;
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段、目标操作类型、目标操作的属性,对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到第二目标对象;
将所述第一目标对象及所述第二目标对象作为目标对象。
可选的,所述装置70还包括:
存储模块,用于将所述目标对象以及所述目标对象所需的特征存储至指定数据库中。
综上所述,本发明实施例提供的一种目标对象提取装置,接收模块可以接收终端发送的特征配置信息,其中,该特征配置信息是终端根据用户在预设界面上的选择操作生成的,该特征配置信息中至少定义目标对象的类别以及目标对象所需的特征,然后,提取模块可以根据特征配置信息中的目标对象的类别以及目标对象所需的特征,提取目标对象。这样,当需要提取符合某种特征的对象时,用户仅需要在终端的预设界面中选择需要提取的对象类别以及对象需要具备的特征因素,终端会基于用户的选择生成特征配置信息,并发送给服务器,进行对象提取,相较于现有技术中针对不同的特征定制化开发相应的实现代码的方式,简化了对象提取的实现过程,降低了实现成本。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
优选的,本发明实施例还提供一种移动终端,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述目标对象提取方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述目标对象提取方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此提供的目标对象提取方法不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的目标对象提取方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (15)

1.一种目标对象提取方法,其特征在于,应用于包括终端及服务器的***,所述方法包括:
所述终端显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项和下沉维度选项;
所述终端检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
所述终端根据所选择的候选对象类别以及所选择的候选特征提取选项和所选择的下沉维度选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;所述下沉维度选项用于控制所述服务器显示提取到的所述目标对象对应的特征中包含的实体对象;
所述终端将所述特征配置信息发送给服务器;
所述服务器根据所述目标对象的类别以及目标对象所需的特征,提取目标对象;不同的候选特征提取选项对应不同的特征提取因素;
所述根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,包括:
将所选择的候选对象类别确定为目标对象的类别;
按照预设格式中所述目标对象的类别以及每个所述特征提取因素的顺序,将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别进行组合,得到特征配置信息。
2.一种目标对象提取方法,其特征在于,应用于终端,所述方法包括:
显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项和下沉维度选项;
检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
根据所选择的候选对象类别以及所选择的候选特征提取选项和下沉维度选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;所述下沉维度选项用于控制服务器显示提取到的所述目标对象对应的特征中包含的实体对象;
将所述特征配置信息发送给所述服务器;不同的候选特征提取选项对应不同的特征提取因素;
所述根据所选择的候选对象类别以及所选择的候选特征提取选项,生成目标对象的特征配置信息,包括:
将所选择的候选对象类别确定为目标对象的类别;
按照预设格式中所述目标对象的类别以及每个所述特征提取因素的顺序,将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别进行组合,得到特征配置信息。
3.一种目标对象提取方法,其特征在于,应用于服务器,所述方法包括:
接收终端发送的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征和目标对象所需的特征中包含的实体对象;
根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象;所述目标对象所需的特征至少包括目标时间段;
显示所述提取到的目标对象对应的特征中包含的实体对象;
所述根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象,包括:
若所述目标对象所需的特征中的目标时间段落入实时数据的时间范围,从实时数据中提取目标对象;或者,
若所述目标对象所需的特征中的目标时间段落入离线数据的时间范围,从离线数据中提取目标对象;或者,
若所述目标对象的特征中的目标时间段的一部分落入所述实时数据的时间范围,且另一部分落入所述离线数据的时间范围,从所述实时数据以及所述离线数据中提取目标对象。
4.根据权利要求3所述的方法,其特征在于,所述从实时数据中提取目标对象,包括:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
5.根据权利要求3所述的方法,其特征在于,所述目标对象所需的特征中还包括目标操作的属性;所述从离线数据中提取目标对象,包括:
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
6.根据权利要求3所述的方法,其特征在于,所述从所述实时数据以及所述离线数据中提取目标对象,包括:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到第一目标对象;
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段、目标操作类型、目标操作的属性,对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到第二目标对象;
将所述第一目标对象及所述第二目标对象作为所述目标对象。
7.根据权利要求3所述的方法,其特征在于,所述根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象之后,所述方法还包括:
将所述目标对象以及所述目标对象所需的特征存储至指定数据库中。
8.一种目标对象提取***,其特征在于,所述***包括终端及服务器;
所述终端,用于显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项和下沉维度选项;
所述终端,还用于检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
所述终端,还用于根据所选择的候选对象类别以及所选择的候选特征提取选项和所选择的下沉维度选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;所述下沉维度选项用于控制所述服务器显示提取到的所述目标对象对应的特征中包含的实体对象;
所述终端,还用于将所述特征配置信息发送给服务器;
所述服务器,用于根据所述目标对象的类别以及目标对象所需的特征,提取目标对象;不同的候选特征提取选项对应不同的特征提取因素;
所述终端,具体用于将所选择的候选对象类别确定为目标对象的类别;按照预设格式中目标对象的类别以及每个特征提取因素的顺序,将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别进行组合,得到特征配置信息。
9.一种目标对象提取装置,其特征在于,应用于终端,所述装置包括:
显示模块,用于显示预设界面;所述预设界面中包括候选对象类别以及候选特征提取选项和下沉维度选项;
检测模块,用于检测用户对所述候选对象类别以及所述候选特征提取选项的选择操作;
生成模块,用于根据所选择的候选对象类别以及所选择的候选特征提取选项和下沉维度选项,生成目标对象的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征;所述下沉维度选项用于控制服务器显示提取到的所述目标对象对应的特征中包含的实体对象;
发送模块,用于将所述特征配置信息发送给所述服务器;
不同的候选特征提取选项对应不同的特征提取因素;
所述生成模块,用于:
将所选择的候选对象类别确定为目标对象的类别;按照预设格式中目标对象的类别以及每个特征提取因素的顺序,将所选择的每个候选特征提取选项对应的特征提取因素以及所述目标对象的类别进行组合,得到特征配置信息。
10.一种目标对象提取装置,其特征在于,应用于服务器,所述装置包括:
接收模块,用于接收终端发送的特征配置信息;所述特征配置信息中至少定义目标对象的类别以及目标对象所需的特征和目标对象所需的特征中包含的实体对象;
提取模块,用于根据所述目标对象的类别以及所述目标对象所需的特征,提取目标对象;所述目标对象所需的特征至少包括目标时间段;
所述装置还用于显示所述提取到的目标对象对应的特征中包含的实体对象;
所述提取模块,包括:
第一提取子模块,用于若所述目标对象所需的特征中的目标时间段落入实时数据的时间范围,从实时数据中提取目标对象;或者,
第二提取子模块,用于若所述目标对象所需的特征中的目标时间段落入离线数据的时间范围,从离线数据中提取目标对象;或者,
第三提取子模块,用于若所述目标对象的特征中的目标时间段的一部分落入所述实时数据的时间范围,且另一部分落入所述离线数据的时间范围,从所述实时数据以及所述离线数据中提取目标对象。
11.根据权利要求10所述的装置,其特征在于,所述第一提取子模块,用于:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
12.根据权利要求10所述的装置,其特征在于,所述目标对象所需的特征中还包括目标操作的属性;所述第二提取子模块,用于:
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到所述目标对象。
13.根据权利要求10所述的装置,其特征在于,所述第三提取子模块,用于:
利用预设的实时计算引擎,从所述实时数据中提取具备所述目标对象所需的特征的对象,得到第一目标对象;
根据所述目标对象所需的特征中所述目标操作的类型,从预设的多个数据源中,选择目标数据源;不同的数据源包括针对不同类型的操作的离线数据;
根据所述目标对象所需的特征中包括的目标时间段、目标操作类型、目标操作的属性,对所述目标数据源中的数据进行筛选,得到待分析离线数据;
利用预设的离线计算引擎,从所述待分析离线数据中提取具备所述目标对象所需的特征的对象,得到第二目标对象;
将所述第一目标对象及所述第二目标对象作为所述目标对象。
14.根据权利要求10所述的装置,其特征在于,所述装置还包括:
存储模块,用于将所述目标对象以及所述目标对象所需的特征存储至指定数据库中。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的目标对象提取方法。
CN201811614035.9A 2018-12-27 2018-12-27 目标对象提取方法、装置、***及计算机可读存储介质 Active CN109918048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811614035.9A CN109918048B (zh) 2018-12-27 2018-12-27 目标对象提取方法、装置、***及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811614035.9A CN109918048B (zh) 2018-12-27 2018-12-27 目标对象提取方法、装置、***及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109918048A CN109918048A (zh) 2019-06-21
CN109918048B true CN109918048B (zh) 2022-09-06

Family

ID=66960038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811614035.9A Active CN109918048B (zh) 2018-12-27 2018-12-27 目标对象提取方法、装置、***及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109918048B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427222A (zh) * 2019-06-24 2019-11-08 北京达佳互联信息技术有限公司 数据加载方法、装置、电子设备及存储介质
CN110502579A (zh) * 2019-08-26 2019-11-26 第四范式(北京)技术有限公司 用于批量和实时特征计算的***和方法
CN112148259B (zh) * 2020-09-23 2024-01-09 北京中电普华信息技术有限公司 一种业务对象的抽象方法与装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426449A (zh) * 2015-11-09 2016-03-23 小米科技有限责任公司 海量数据查询方法和装置、服务器
CN105912587A (zh) * 2016-03-31 2016-08-31 乐视控股(北京)有限公司 一种数据采集方法和***
CN107797826A (zh) * 2017-05-19 2018-03-13 平安科技(深圳)有限公司 一种基于规则引擎的规则配置方法、终端以及设备
CN107908392A (zh) * 2017-11-13 2018-04-13 平安科技(深圳)有限公司 数据采集工具包定制方法、装置、终端和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426449A (zh) * 2015-11-09 2016-03-23 小米科技有限责任公司 海量数据查询方法和装置、服务器
CN105912587A (zh) * 2016-03-31 2016-08-31 乐视控股(北京)有限公司 一种数据采集方法和***
CN107797826A (zh) * 2017-05-19 2018-03-13 平安科技(深圳)有限公司 一种基于规则引擎的规则配置方法、终端以及设备
CN107908392A (zh) * 2017-11-13 2018-04-13 平安科技(深圳)有限公司 数据采集工具包定制方法、装置、终端和存储介质

Also Published As

Publication number Publication date
CN109918048A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
CN107885796B (zh) 信息推荐方法及装置、设备
CN109918048B (zh) 目标对象提取方法、装置、***及计算机可读存储介质
CN109450771B (zh) 添加好友的方法、装置、计算机设备及存储介质
CN107305611B (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理***
CN105634855B (zh) 网络地址的异常识别方法及装置
CN109597974B (zh) 报表生成方法及装置
US20070256033A1 (en) System and method for flagging information content
CN111163072B (zh) 机器学习模型中特征值的确定方法、装置及电子设备
CN107808346B (zh) 一种潜在目标对象的评估方法及评估装置
CN111444287B (zh) 图数据库构建方法、关联信息查询方法、装置及计算设备
CN112861026B (zh) 用户偏好挖掘方法、装置、介质和电子设备
CN110781372A (zh) 一种优化网站的方法、装置、计算机设备及存储介质
CN112819611A (zh) 欺诈识别方法、装置、电子设备和计算机可读存储介质
CN102315955A (zh) 一种为垃圾信息设置障碍的控制方法以及相应的控制装置
CN109213782B (zh) 搜索界面的配置、显示方法、装置及通信设备
CN106294406A (zh) 一种用于处理应用访问数据的方法与设备
CN111683280B (zh) 视频处理方法、装置及电子设备
CN109145307B (zh) 用户画像识别方法、推送方法、装置、设备和存储介质
CN111178421A (zh) 检测用户状态的方法、装置、介质以及电子设备
CN113610535B (zh) 适用于消费分期业务过程的风险监控方法及装置
CN109831415B (zh) 一种对象处理方法、装置、***及计算机可读存储介质
CN113672497B (zh) 无埋点事件的生成方法、装置、设备及存储介质
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN109947803B (zh) 一种数据处理方法、***及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant