CN106997431A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN106997431A
CN106997431A CN201610046778.5A CN201610046778A CN106997431A CN 106997431 A CN106997431 A CN 106997431A CN 201610046778 A CN201610046778 A CN 201610046778A CN 106997431 A CN106997431 A CN 106997431A
Authority
CN
China
Prior art keywords
bitmap
monocase
numerical value
user
unit interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610046778.5A
Other languages
English (en)
Other versions
CN106997431B (zh
Inventor
黄海
沈涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610046778.5A priority Critical patent/CN106997431B/zh
Publication of CN106997431A publication Critical patent/CN106997431A/zh
Application granted granted Critical
Publication of CN106997431B publication Critical patent/CN106997431B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/316User authentication by observing the pattern of computer usage, e.g. typical user behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种数据处理方法及装置,在本发明中,对于任一用户和任一操作特征,无论该用户出现过几次该操作特征,本发明实施例中的用户标识、操作特征与位图三者之间的对应关系中仅仅会存储一个该用户的用户标识和一个该操作特征,不存储执行时刻,而是利用位图来表示每一单位时间段是否出现该操作特征,其中,在某一用户标识和某一操作特征对应的位图中包括多个单字符数值,任一单字符数值都可以表示该用户标识对应的用户在该单字符数值对应的单位时间段是否出现了该操作特征,因此,相比于现有技术,本发明实施例可以节省存储空间。

Description

一种数据处理方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法及装置。
背景技术
当前,用户在网络上执行诸如支付、转账或登录等敏感操作的次数越来越多,这些敏感操作往往与用户的财产息息相关,因此,为了保障用户的财产不受损失,当用户在执行某一敏感操作时,需要判断该敏感操作是否存在风险,并当该敏感操作存在风险时中断该敏感操作。
目前,通常会采用如下方式来判断该敏感操作是否存在风险,包括:获取该敏感操作的当前操作特征,获取用户在执行该敏感操作之前的一段时间内执行的每一个该敏感操作的历史操作特征,判断当前操作特征与历史操作特征之间是否存在显著差异,当存在显著差异时,确定该敏感操作存在风险。
其中,为了能够采用上述方法判断用户执行的每一敏感操作是否存在风险,每当用户执行一个敏感操作时,需要获取执行该敏感操作时的执行时刻以及获取该敏感操作的操作特征,然后将用户的用户标识、该操作特征与该执行时刻组成一条记录并存储在本地存储的用户标识、操作特征与执行时刻三者之间的对应关系中,其中,执行时刻的表示方式为年月日时分秒,例如,2015年08月05日23时35分03秒;对于其他用户同样如此。
然而,发明人在实现本发明的过程中发现,相关技术中的这种方案至少存在如下缺点:
当一个用户一天执行很多个敏感操作时,上述对应关系中会存储很多条关于该一个用户的记录,每一条记录都包含该用户的用户标识、一个操作特征以及一个执行时刻,总体上会占用非常多的存储空间,当用户较多且计算的天数较多时,这样上述对应关系所占用的存储空间就会呈几何式增长。
发明内容
为克服相关技术中存在的问题,本发明提供一种数据处理方法及装置。
根据本发明实施例的第一方面,提供一种数据处理方法,所述方法包括:
当获取到用户在执行敏感操作时的执行时刻和所述敏感操作的操作特征时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在与所述用户标识和所述操作特征相对应的位图;
当存在与所述用户标识和所述操作特征相对应的位图时,计算位于所述位图的末尾的单字符数值对应的单位时间段与所述执行时刻所在的单位时间段之间间隔的单位时间段的个数;单字符数值仅包括一个字符;
在所述位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值。
进一步地,所述方法还包括:
当不存在与所述用户标识和所述操作特征相对应的位图时,根据所述第二预设单字符数值创建位图;
将所述用户标识、所述操作特征与所述创建的位图组成一条记录存储在所述第一对应关系中。
其中,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述在所述位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值,包括:
确定所述执行时刻所在的单位时间段;
在所述第二对应关系中查找所述确定出的单位时间段所在的目标时间段;
在所述第二对应关系中查找与所述查找到的目标时间段相对应的子位图;
在所述子位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的子位图的末尾补充一个第二预设单字符数值。
进一步地,所述方法还包括:
当要查询待查询用户在待查询单位时间段出现的操作特征的种类的总个数时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在包括所述待查询用户的用户标识的目标记录;
当存在包括所述待查询用户的用户标识的目标记录时,对于每一所述目标记录,在所述目标记录中的位图中,判断所述待查询单位时间段对应的单字符数值中是否存在所述第二预设单字符数值;
在所有所述目标记录的位图中,统计所述待查询单位时间段对应的单字符数值中存在所述第二预设单字符数值的位图的个数,并作为所述总个数。
其中,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述判断所述待查询单位时间段对应的单字符数值中是否存在所述第二预设单字符数值,包括:
在所述第二对应关系中查找所述待查询单位时间段所在的目标时间段;
在所述第二对应关系中查找与所述目标时间段相对应的目标子位图;
在所述目标子位图中查找与所述待查询单位时间段对应的单字符数值;
判断所述查找到的单字符数值中是否存在所述第二预设单字符数值。
根据本发明实施例的第二方面,提供一种数据处理装置,所述装置包括:
第一查找模块,用于当获取到用户在执行敏感操作时的执行时刻和所述敏感操作的操作特征时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在与所述用户标识和所述操作特征相对应的位图;
计算模块,用于当存在与所述用户标识和所述操作特征相对应的位图时,计算位于所述位图的末尾的单字符数值对应的单位时间段与所述执行时刻所在的单位时间段之间间隔的单位时间段的个数;单字符数值仅包括一个字符;
补充模块,用于在所述位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值。
进一步地,所述装置还包括:
创建模块,用于当不存在与所述用户标识和所述操作特征相对应的位图时,根据所述第二预设单字符数值创建位图;
存储模块,用于将所述用户标识、所述操作特征与所述创建的位图组成一条记录存储在所述第一对应关系中。
其中,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述补充模块包括:
确定单元,用于确定所述执行时刻所在的单位时间段;
第一查找单元,用于在所述第二对应关系中查找所述确定出的单位时间段所在的目标时间段;
第二查找单元,用于在所述第二对应关系中查找与所述查找到的目标时间段相对应的子位图;
补充单元,用于在所述子位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的子位图的末尾补充一个第二预设单字符数值。
进一步地,所述装置还包括:
第二查找模块,用于当要查询待查询用户在待查询单位时间段出现的操作特征的种类的总个数时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在包括所述待查询用户的用户标识的目标记录;
判断模块,用于当存在包括所述待查询用户的用户标识的目标记录时,对于每一所述目标记录,在所述目标记录中的位图中,判断所述待查询单位时间段对应的单字符数值中是否存在所述第二预设单字符数值;
统计模块,用于在所有所述目标记录的位图中,统计所述待查询单位时间段对应的单字符数值中存在所述第二预设单字符数值的位图的个数,并作为所述总个数。
其中,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述判断模块包括:
第三查找单元,用于在所述第二对应关系中查找所述待查询单位时间段所在的目标时间段;
第四查找单元,用于在所述第二对应关系中查找与所述目标时间段相对应的目标子位图;
第五查找单元,用于在所述目标子位图中查找与所述待查询单位时间段对应的单字符数值;
判断单元,用于判断所述查找到的单字符数值中是否存在所述第二预设单字符数值。
本发明的实施例提供的技术方案可以包括以下有益效果:
在现有技术中,对于任一用户和任一操作特征,该用户出现过几次该操作特征,现有技术中的对应关系就会存储几个该用户的用户标识、几个该操作特征以及几个单位时间段,现有技术中的时刻的表示方式为年月日时分秒。
而在本发明中,对于任一用户和任一操作特征,无论该用户出现过几次该操作特征,本发明实施例中的用户标识、操作特征与位图三者之间的对应关系中仅仅会存储一个该用户的用户标识和一个该操作特征,不存储执行时刻,而是利用位图来表示每一单位时间段是否出现该操作特征,其中,在某一用户标识和某一操作特征对应的位图中包括多个单字符数值,任一单字符数值都可以表示该用户标识对应的用户在该单字符数值对应的单位时间段是否出现了该操作特征,因此,相比于现有技术,本发明实施例可以节省存储空间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种数据处理方法的流程图;
图2是根据一示例性实施例示出的一种数据处理方法的流程图;
图3是根据一示例性实施例示出的一种数据处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种数据处理方法的流程图,如图1所示,该方法用于终端中,包括以下步骤。
在步骤S101中,当获取到用户在执行敏感操作时的执行时刻和该敏感操作的操作特征时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在与该用户标识和该操作特征相对应的位图;
在本发明实施例中,用户标识用于唯一标识用户,用于标识可以为用户的名称或用户账户的用户账号等,本发明对此不加以限定。
敏感操作可以为支付、转账和登录等与用户的财产息息相关的操作。
一般情况下,用户是在自己使用的终端上执行敏感操作,因此,操作特征可以为用户使用的终端的IP地址或者用户使用的终端的硬件标识等等,不同的终端的硬件标识不同。终端可以为手机、平板电脑或智能穿戴设备等等,本发明对此不加以限定。
例如,当用户需要登录服务器时,用户可以在终端上获取用于登录服务器的登录页面,登录页面包括登录账号输入框、登录密码输入框和登录按钮,用户可以在登录账号输入框中输入用户账号,以及在登录密码输入框中输入用户密码,然后点击登录按钮;当终端接收到用户点击登录按钮的操作时,确定接收到敏感操作,此时终端就会获取终端的当前时刻并作为用户执行该敏感操作时的执行时刻,然后获取用户在登录页面输入的用户账号和用户密码,以及获取终端当前的IP地址或硬件标识并作为该敏感操作的操作特征,之后终端向服务器发送该用户账号、该用户密码、该执行时刻和该操作特征。
服务器接收终端发送该用户账号、该用户密码、该执行时刻和该操作特征,然后获取本地存储的用户标识、操作特征与位图三者之间的第一对应关系,并在第一对应关系中查找是否存在与该用户标识和该操作特征相对应的位图。
当存在与该用户标识和该操作特征相对应的位图时,在步骤S102中,计算位于该位图的末尾的单字符数值对应的单位时间段与该执行时刻所在的单位时间段之间间隔的单位时间段的个数;
位图由多个单字符数值构成,任意一个单字符数值为第一预设单字符数值或第二预设单字符数值,其中,第一预设单字符数值可以为0,第二预设单字符数值可以为1。
位图中的每一单字符数值都对应一个单位时间段,在任意两个相邻的单字符数值中,该两个单字符数值对应的时间段也相邻。其次,在一个位图中,假设单字符数值1与单字符数值2相邻,且单字符数值1位于单字符数值2之前,则单字符数值1对应的单位时间段与单字符数值2对应的单位时间段相邻且单字符数值1对应的单位时间段位于单字符数值2对应的单位时间段之前。
单位时间段的时长可以为1秒、2秒或3秒等,本发明对此不加以限定。需要说明的是,在本发明实施例中,仅以单位时间段的时长为1秒进行举例说明,但不作为对本发明保护范围的限制。
其中,当要获取位图中的某一单字符数值对应的执行时刻所在的单位时间段时,可以查找该单字符数值在位图中的顺序编号,该单字符数值在位图中的顺序编号可以为:位于该单字符数值之前的单字符数值的个数+1。该单字符数值对应的执行时刻所在的单位时间段即为排序为该顺序编号的单位时间段;例如,排序为1的单位时间段为第0秒~第1秒,排序为2的单位时间段为第1秒~第2秒,排序为3的单位时间段为第2秒~第3秒等等。
其中,在用户标识、操作特征与位图三者之间的第一对应关系中的某一条记录中,当该记录中的位图中的某一单字符数值为第一预设单字符数值时,则表示该记录中的用户标识对应的用户在该某一单字符数值对应的单位时间段出现过该记录中的操作特征;当该记录中的位图中的某一单字符数值为第二预设单字符数值时,则表示该记录中的用户标识对应的用户在该某一单字符数值对应的单位时间段未出现过该记录中的操作特征。
在本发明实施例中,对于该用户和该操作特征,当该用户在某一单位时间段出现了该操作特征时并在位图的末尾补充第二预设单字符数值后,如果在该单位时间段之后的一个或连续多个单位时间段未出现该特征,无需在该位图的末尾补充第一预设单字符数值,直至该用户在该单位时间段之后的一个单位时间段出现了该操作特征时,确定出该单位时间段与在该单位时间段之后的该一个单位时间段之间间隔的单位时间段的个数,然后在位图的末尾补充该个数个第一预设单字符数值,再在补充了该个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值。
例如,假设单位时间段的时长为1秒,第一预设单字符数值为0,以及第二预设单字符数值为1。对用户1和操作特征IP1,假设此时与用户1和IP1相对应的位图为“001101”,从位图“001101”可以得出:用户1在第1秒~第2秒未出现IP1,用户1在第2秒~第3秒未出现IP1,用户1在第3秒~第4秒出现了IP1,用户1在第4秒~第5秒出现了IP1,用户1在第5秒~第6秒未出现IP1,用户在在第6秒~第7秒出现了IP1。
假设用户1在第7秒~第8秒未出现IP1,则无需对用户1与IP1对应的位图“001101”进行更新,如果用户1在第8秒~第9秒以及在第9秒~第10秒也未出现特征IP1,且直至第10秒~第11秒用户1才出现了IP1,由于位于位图“001101”末尾的单字符数值“1”对应的单位时间段为为第6秒~第7秒,第6秒~第7秒与第10秒~第11秒之间的间隔了三个单位时间段,分别为:第7秒~第8秒、第8秒~第9秒和第9秒~第10秒,则在位图“001101”末尾补充3个0,得到位图“001101000”,然后在位图“001101000”末尾补充一个1得到位图“0011010001”。
在步骤S103中,在该位图的末尾补充该个数个第一预设单字符数值,以及在补充了该个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值;
优选地,第一预设单字符数值可以为0,第二预设单字符数值可以为1。
在本发明实施例中,有时候一条记录中的位图包括的单字符数值的个数会非常多,例如,假设单位时间段的时长为1秒,一天包括86400个单位时间段,每个单位时间段都对应一个单字符数值,则经过很多天之后,在位图包括的单字符数值的个数将不计其数。
当一条记录中的位图包括的单字符数值的个数非常多时,如果要在该一条位图中查找某一单位时间段对应的单字符数值时,在非常多的单字符数值中查找该单位时间段对应的单字符数值会花费很多时间,查找效率较低。
因此,为了提高查找效率,在本发明另一实施例中,对于用户标识、操作特征与位图三者之间的第一对应关系中的任意一条记录,将该记录中的位图按照目标时间段拆分为多个子位图,目标时间段的时长大于单位时间段的时长,对于拆分的任一子位图,将该子位图对应的目标时间段与该子位图存储在目标时间段与子位图之间的第二对应关系中,对于拆分的其他每一子位图,均执行上述操作。此时第一对应关系中的位图为目标时间段与子位图之间的第二对应关系。
目标时间段的时长可以为6小时、12小时或24小时等,本发明对此不加以限定,本发明实施例以目标时间段的时长为24小时进行举例说明,但不作为对本发明保护范围的限制,也即目标时间段的时长为86400秒,一个子位图中最多包括86400个单字符数值。其中,在本发明实施例中,每一天可以为一个目标时间段,这样,目标时间段就可以为日期,例如某某年某某月某某日。
这样,如果要查找某一单位时间段对应的单字符数值,可以先确定出该单位时间段所在的目标时间段,然后在目标时间段与子位图之间的第二对应关系中查找与该目标时间段相对应的子位图,之后在该子位图中查找该单位时间段对应的单字符数值,由于该子位图中包括的单字符数值的个数较少,因此可以快速从该子位图中查找到该单位时间段对应的单字符数值。
例如,如果要查找2015年08月08日15时3分第20~21秒对应的单字符数值,则可以首先确定出目标时间段为2015年08月08日,然后在目标时间段与子位图之间的第二对应关系中查找与目标时间段2015年08月08日对应的子位图,然后在与目标时间段2015年08月08日对应的子位图中查找15时3分第20~21秒对应的单字符数值。
其中,在本步骤S103中,可以确定该执行时刻所在的单位时间段;在第二对应关系中查找确定出的单位时间段所在的目标时间段;在第二对应关系中查找与查找到的目标时间段相对应的子位图;在该子位图的末尾补充该个数个第一预设单字符数值,以及在补充了该个数个第一预设单字符数值的子位图的末尾补充一个第二预设单字符数值。
当不存在与该用户标识和操作特征相对应的位图时,在步骤S104中,根据第二预设单字符数值创建位图;
当不存在与该用户的用户标识和该操作特征相对应的位图时,说明该用户在历史过程中还未曾出现过该操作特征,此时为了将该用户在该执行时刻出现的该操作特征存储下来,需要根据第二预设单字符数值创建一个位图。其中,可以统计位于该执行时刻所在的单位时间段之前的单位时间段的数量,生成一个空位图,在空位图中补充该数量个第一预设单字符数值,然后在最后一个第一预设单字符数值补充第二预设单字符数值。
在步骤S105中,将该用户标识、该操作特征与创建的位图组成一条记录并存储在第一对应关系中。
在本发明另一实施例中,有时候一个位图中可能会连续出现目标数量个第一预设单字符数值,目标数量大于或等于4,由于连续出现目标数量个第一预设单字符数值包括的字符的数量较多,因此,当一个位图中连续出现目标数量个第一预设单字符数值时,可以将位图中连续出现目标数量个第一预设单字符数值替换为“目标数量预设标识符第一预设单字符数值”,预设标识符仅包括一个字符,可以为“×”或“+”等,本发明对此不加以限定。
其中,在字母表A~Z中,每一个字母在字母表A~Z中的排序编号都不一样,例如,A在字母表A~Z中的排序编号为1,B在字母表A~Z中的排序编号为2,以及Z在字母表A~Z中的排序编号为26。因此,在本发明另一实施例中,可以利用字母在字母表A~Z中的排序编号来表示目标数量。
这样,当目标数量小于或等于26时,“目标数量预设标识符第一预设单字符数值”仅仅包括3个字符,从而可以节省存储空间。例如,假设位图中连续出现了10个0,可以将连续出现的10个0替换为“J×0”。
当目标数量大于26时,“目标数量预设标识符第一预设单字符数值”包括的字符虽然大于3,但仍旧可以节省存储空间;以及当目标数量远远大于26时,节省存储空间的效果更佳明显。例如,假设位图中连续出现了52个0,可以将连续出现的52个0替换为“2×Z×0”。或者,假设,假设位图中连续出现了45个0,可以将连续出现的45个0替换为“3×O×0”。
其中,有时候一个位图中也可能会连续出现目标数量个第二预设单字符数值,目标数量大于或等于4,由于连续出现目标数量个第二预设预设单字符数值包括的字符的数量较多,因此,当一个位图中连续出现目标数量个第二预设单字符数值时,可以将位图中连续出现目标数量个第一预设单字符数值按照上述方式替换为“目标数量预设标识符第二预设单字符数值”,从而节省存储空间。
在现有技术中,对于任一用户和任一操作特征,该用户出现过几次该操作特征,现有技术中的对应关系就会存储几个该用户的用户标识、几个该操作特征以及几个单位时间段,现有技术中的时刻的表示方式为年月日时分秒。
而在本发明图1所示的实施例中,对于任一用户和任一操作特征,无论该用户出现过几次该操作特征,本发明实施例中的用户标识、操作特征与位图三者之间的对应关系中仅仅会存储一个该用户的用户标识和一个该操作特征,不存储执行时刻,而是利用位图来表示每一单位时间段是否出现该操作特征,其中,在某一用户标识和某一操作特征对应的位图中包括多个单字符数值,任一单字符数值都可以表示该用户标识对应的用户在该单字符数值对应的单位时间段是否出现了该操作特征,因此,相比于现有技术,本发明实施例可以节省存储空间。
之后,可能会需要查询用户在某一单位时间段内出现的操作特征的种类的总个数,在本发明又一实施例中,可以通过如下方法来查询用户在某一单位时间段内出现的操作特征的种类的总个数,参见图2,该方法包括:
在步骤S201中,当要查询待查询用户在待查询单位时间段出现的操作特征的种类的总个数时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在包括待查询用户的用户标识的目标记录;
当存在包括待查询用户的用户标识的目标记录时,在步骤S202中,对于每一目标记录,在目标记录中的位图中,判断待查询单位时间段对应的单字符数值中是否存在第二预设单字符数值;
进一步地,当不存在包括待查询用户的用户标识的目标记录时,则说明在历史过程中用户未出现过该操作特征,从而结束流程。
在本发明另一实施例中,如果第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
则本步骤具体可以为:对于任一目标记录,该目标记录中的位图为目标时间段与子位图之间的第二对应关系,在上述第二对应关系中查找待查询单位时间段所在的目标时间段;在上述第二对应关系中查找与查找到的目标时间段相对应的目标子位图;在目标子位图中查找与待查询单位时间段对应的单字符数值;判断查找到的单字符数值中是否存在第二预设单字符数值。对于其他每一目标记录,均执行上述操作。
在步骤S203中,在所有目标记录的位图中,统计待查询单位时间段对应的单字符数值中存在第二预设单字符数值的位图的个数,并作为该总个数。
图3是根据一示例性实施例示出的一种数据处理装置的框图。参照图3,该装置包括:
第一查找模块11,用于当获取到用户在执行敏感操作时的执行时刻和所述敏感操作的操作特征时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在与所述用户标识和所述操作特征相对应的位图;
计算模块12,用于当存在与所述用户标识和所述操作特征相对应的位图时,计算位于所述位图的末尾的单字符数值对应的单位时间段与所述执行时刻所在的单位时间段之间间隔的单位时间段的个数;单字符数值仅包括一个字符;
补充模块13,用于在所述位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值。
进一步地,所述装置还包括:
创建模块,用于当不存在与所述用户标识和所述操作特征相对应的位图时,根据所述第二预设单字符数值创建位图;
存储模块,用于将所述用户标识、所述操作特征与所述创建的位图组成一条记录存储在所述第一对应关系中。
其中,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述补充模块13包括:
确定单元,用于确定所述执行时刻所在的单位时间段;
第一查找单元,用于在所述第二对应关系中查找所述确定出的单位时间段所在的目标时间段;
第二查找单元,用于在所述第二对应关系中查找与所述查找到的目标时间段相对应的子位图;
补充单元,用于在所述子位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的子位图的末尾补充一个第二预设单字符数值。
进一步地,所述装置还包括:
第二查找模块,用于当要查询待查询用户在待查询单位时间段出现的操作特征的种类的总个数时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在包括所述待查询用户的用户标识的目标记录;
判断模块,用于当存在包括所述待查询用户的用户标识的目标记录时,对于每一所述目标记录,在所述目标记录中的位图中,判断所述待查询单位时间段对应的单字符数值中是否存在所述第二预设单字符数值;
统计模块,用于在所有所述目标记录的位图中,统计所述待查询单位时间段对应的单字符数值中存在所述第二预设单字符数值的位图的个数,并作为所述总个数。
其中,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述判断模块包括:
第三查找单元,用于在所述第二对应关系中查找所述待查询单位时间段所在的目标时间段;
第四查找单元,用于在所述第二对应关系中查找与所述目标时间段相对应的目标子位图;
第五查找单元,用于在所述目标子位图中查找与所述待查询单位时间段对应的单字符数值;
判断单元,用于判断所述查找到的单字符数值中是否存在所述第二预设单字符数值。
在现有技术中,对于任一用户和任一操作特征,该用户出现过几次该操作特征,现有技术中的对应关系就会存储几个该用户的用户标识、几个该操作特征以及几个单位时间段,现有技术中的时刻的表示方式为年月日时分秒。
而在本发明图3所示的实施例中,对于任一用户和任一操作特征,无论该用户出现过几次该操作特征,本发明实施例中的用户标识、操作特征与位图三者之间的对应关系中仅仅会存储一个该用户的用户标识和一个该操作特征,不存储执行时刻,而是利用位图来表示每一单位时间段是否出现该操作特征,其中,在某一用户标识和某一操作特征对应的位图中包括多个单字符数值,任一单字符数值都可以表示该用户标识对应的用户在该单字符数值对应的单位时间段是否出现了该操作特征,因此,相比于现有技术,本发明实施例可以节省存储空间。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种数据处理方法,其特征在于,所述方法包括:
当获取到用户在执行敏感操作时的执行时刻和所述敏感操作的操作特征时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在与所述用户标识和所述操作特征相对应的位图;
当存在与所述用户标识和所述操作特征相对应的位图时,计算位于所述位图的末尾的单字符数值对应的单位时间段与所述执行时刻所在的单位时间段之间间隔的单位时间段的个数;单字符数值仅包括一个字符;
在所述位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当不存在与所述用户标识和所述操作特征相对应的位图时,根据所述第二预设单字符数值创建位图;
将所述用户标识、所述操作特征与所述创建的位图组成一条记录存储在所述第一对应关系中。
3.根据权利要求1所述的方法,其特征在于,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述在所述位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值,包括:
确定所述执行时刻所在的单位时间段;
在所述第二对应关系中查找所述确定出的单位时间段所在的目标时间段;
在所述第二对应关系中查找与所述查找到的目标时间段相对应的子位图;
在所述子位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的子位图的末尾补充一个第二预设单字符数值。
4.根据权利要求1-3任一项权利要求所述的方法,其特征在于,所述方法还包括:
当要查询待查询用户在待查询单位时间段出现的操作特征的种类的总个数时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在包括所述待查询用户的用户标识的目标记录;
当存在包括所述待查询用户的用户标识的目标记录时,对于每一所述目标记录,在所述目标记录中的位图中,判断所述待查询单位时间段对应的单字符数值中是否存在所述第二预设单字符数值;
在所有所述目标记录的位图中,统计所述待查询单位时间段对应的单字符数值中存在所述第二预设单字符数值的位图的个数,并作为所述总个数。
5.根据权利要求4所述的方法,其特征在于,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述判断所述待查询单位时间段对应的单字符数值中是否存在所述第二预设单字符数值,包括:
在所述第二对应关系中查找所述待查询单位时间段所在的目标时间段;
在所述第二对应关系中查找与所述目标时间段相对应的目标子位图;
在所述目标子位图中查找与所述待查询单位时间段对应的单字符数值;
判断所述查找到的单字符数值中是否存在所述第二预设单字符数值。
6.一种数据处理装置,其特征在于,所述装置包括:
第一查找模块,用于当获取到用户在执行敏感操作时的执行时刻和所述敏感操作的操作特征时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在与所述用户标识和所述操作特征相对应的位图;
计算模块,用于当存在与所述用户标识和所述操作特征相对应的位图时,计算位于所述位图的末尾的单字符数值对应的单位时间段与所述执行时刻所在的单位时间段之间间隔的单位时间段的个数;单字符数值仅包括一个字符;
补充模块,用于在所述位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的位图的末尾补充一个第二预设单字符数值。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
创建模块,用于当不存在与所述用户标识和所述操作特征相对应的位图时,根据所述第二预设单字符数值创建位图;
存储模块,用于将所述用户标识、所述操作特征与所述创建的位图组成一条记录存储在所述第一对应关系中。
8.根据权利要求6所述的装置,其特征在于,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述补充模块包括:
确定单元,用于确定所述执行时刻所在的单位时间段;
第一查找单元,用于在所述第二对应关系中查找所述确定出的单位时间段所在的目标时间段;
第二查找单元,用于在所述第二对应关系中查找与所述查找到的目标时间段相对应的子位图;
补充单元,用于在所述子位图的末尾补充所述个数个第一预设单字符数值,以及在补充了所述个数个第一预设单字符数值的子位图的末尾补充一个第二预设单字符数值。
9.根据权利要求6-8任一项权利要求所述的装置,其特征在于,所述装置还包括:
第二查找模块,用于当要查询待查询用户在待查询单位时间段出现的操作特征的种类的总个数时,在用户标识、操作特征与位图三者之间的第一对应关系中,查找是否存在包括所述待查询用户的用户标识的目标记录;
判断模块,用于当存在包括所述待查询用户的用户标识的目标记录时,对于每一所述目标记录,在所述目标记录中的位图中,判断所述待查询单位时间段对应的单字符数值中是否存在所述第二预设单字符数值;
统计模块,用于在所有所述目标记录的位图中,统计所述待查询单位时间段对应的单字符数值中存在所述第二预设单字符数值的位图的个数,并作为所述总个数。
10.根据权利要求9所述的装置,其特征在于,所述第一对应关系中的位图为目标时间段与子位图之间的第二对应关系;目标时间段的时长大于单位时间段的时长;
所述判断模块包括:
第三查找单元,用于在所述第二对应关系中查找所述待查询单位时间段所在的目标时间段;
第四查找单元,用于在所述第二对应关系中查找与所述目标时间段相对应的目标子位图;
第五查找单元,用于在所述目标子位图中查找与所述待查询单位时间段对应的单字符数值;
判断单元,用于判断所述查找到的单字符数值中是否存在所述第二预设单字符数值。
CN201610046778.5A 2016-01-22 2016-01-22 一种数据处理方法及装置 Active CN106997431B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610046778.5A CN106997431B (zh) 2016-01-22 2016-01-22 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610046778.5A CN106997431B (zh) 2016-01-22 2016-01-22 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN106997431A true CN106997431A (zh) 2017-08-01
CN106997431B CN106997431B (zh) 2020-09-25

Family

ID=59428275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610046778.5A Active CN106997431B (zh) 2016-01-22 2016-01-22 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN106997431B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108415978A (zh) * 2018-02-09 2018-08-17 北京腾云天下科技有限公司 用户标签存储方法、用户画像计算方法及计算设备
CN108415952A (zh) * 2018-02-02 2018-08-17 北京腾云天下科技有限公司 用户数据存储方法、标签计算方法及计算设备
CN109471786A (zh) * 2018-11-16 2019-03-15 苏州好玩友网络科技有限公司 一种数据采集方法、装置、设备和存储介质
CN110442599A (zh) * 2019-07-29 2019-11-12 浙江大华技术股份有限公司 一种数据处理、隐匿车辆查询的方法及设备
CN111415200A (zh) * 2020-03-20 2020-07-14 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法及装置
CN112269726A (zh) * 2020-10-22 2021-01-26 腾讯音乐娱乐科技(深圳)有限公司 一种数据处理方法及装置
CN112527803A (zh) * 2020-12-30 2021-03-19 北京百家科技集团有限公司 一种数据处理方法、装置以及计算机设备
CN114356972A (zh) * 2021-12-03 2022-04-15 四川科瑞软件有限责任公司 一种数据处理方法、基于事件时间的检索方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419535A (zh) * 2008-11-19 2009-04-29 北京航空航天大学 虚拟机的分布式虚拟磁盘***
CN101582817A (zh) * 2009-06-29 2009-11-18 华中科技大学 网络交互行为模式提取及相似性分析方法
US20110251991A1 (en) * 2005-12-01 2011-10-13 International Business Machines Corporation Journaling database changes using minimized journal entries that may be output in human-readable form
CN103179132A (zh) * 2013-04-09 2013-06-26 中国信息安全测评中心 一种检测和防御cc攻击的方法及装置
CN103581626A (zh) * 2013-11-04 2014-02-12 浙江宇视科技有限公司 一种视频监控***及其视频存储信息记录方法
CN104486777A (zh) * 2014-12-01 2015-04-01 中国联合网络通信集团有限公司 一种实现数据处理的方法及装置
CN104680395A (zh) * 2009-08-28 2015-06-03 谷歌公司 受众分组估计

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110251991A1 (en) * 2005-12-01 2011-10-13 International Business Machines Corporation Journaling database changes using minimized journal entries that may be output in human-readable form
CN101419535A (zh) * 2008-11-19 2009-04-29 北京航空航天大学 虚拟机的分布式虚拟磁盘***
CN101582817A (zh) * 2009-06-29 2009-11-18 华中科技大学 网络交互行为模式提取及相似性分析方法
CN104680395A (zh) * 2009-08-28 2015-06-03 谷歌公司 受众分组估计
CN103179132A (zh) * 2013-04-09 2013-06-26 中国信息安全测评中心 一种检测和防御cc攻击的方法及装置
CN103581626A (zh) * 2013-11-04 2014-02-12 浙江宇视科技有限公司 一种视频监控***及其视频存储信息记录方法
CN104486777A (zh) * 2014-12-01 2015-04-01 中国联合网络通信集团有限公司 一种实现数据处理的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FREEDOMAI: ""位图法统计活跃用户"", 《HTTPS://BLOG.CSDN.NET/FREEDOMAI/ARTICLE/DETAILS/48167363》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108415952A (zh) * 2018-02-02 2018-08-17 北京腾云天下科技有限公司 用户数据存储方法、标签计算方法及计算设备
CN108415978A (zh) * 2018-02-09 2018-08-17 北京腾云天下科技有限公司 用户标签存储方法、用户画像计算方法及计算设备
CN108415978B (zh) * 2018-02-09 2021-04-09 北京腾云天下科技有限公司 用户标签存储方法、用户画像计算方法及计算设备
CN109471786A (zh) * 2018-11-16 2019-03-15 苏州好玩友网络科技有限公司 一种数据采集方法、装置、设备和存储介质
CN110442599A (zh) * 2019-07-29 2019-11-12 浙江大华技术股份有限公司 一种数据处理、隐匿车辆查询的方法及设备
CN111415200A (zh) * 2020-03-20 2020-07-14 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法及装置
CN111415200B (zh) * 2020-03-20 2023-05-26 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法及装置
CN112269726A (zh) * 2020-10-22 2021-01-26 腾讯音乐娱乐科技(深圳)有限公司 一种数据处理方法及装置
CN112527803A (zh) * 2020-12-30 2021-03-19 北京百家科技集团有限公司 一种数据处理方法、装置以及计算机设备
CN112527803B (zh) * 2020-12-30 2024-01-26 北京百家科技集团有限公司 一种数据处理方法、装置以及计算机设备
CN114356972A (zh) * 2021-12-03 2022-04-15 四川科瑞软件有限责任公司 一种数据处理方法、基于事件时间的检索方法和装置

Also Published As

Publication number Publication date
CN106997431B (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
CN106997431A (zh) 一种数据处理方法及装置
US20130346447A1 (en) Systems and methods for behavioral pattern mining
EP3370391B1 (en) System for data cleansing based aggregation and prioritization of it asset field values from real-time event logs and method thereof
Hasija et al. Scheduling in flowshops to minimize total tardiness of jobs
CN106599725B (zh) 图数据发布的随机化隐私保护方法
Sung et al. Extended optimal replacement policy for a two-unit system with failure rate interaction and external shocks
CN105577402B (zh) 基于历史数据的业务异常监控方法及设备
CN107330119B (zh) 缓存数据处理方法、电子设备、计算机存储介质
CN110795471A (zh) 数据匹配的方法及装置、计算机可读存储介质、电子设备
CN106487860A (zh) 工作信息的处理方法及装置
CN108259533A (zh) 一种数据传输方法和装置
CN104778177A (zh) 数据处理方法及装置
Jin et al. Single machine scheduling with sequence-dependent family setups to minimize maximum lateness
CN110807618A (zh) 一种动态排班方法、装置和设备
CN104239538B (zh) 一种快照型日志压缩方法、***及装置
CN113902411A (zh) 项目时间进度展示方法、装置、终端及存储介质
CN110362540A (zh) 一种数据存储、访客数获取方法及装置
CN106528575A (zh) 数据对接方法和装置
JP2008129796A (ja) 電話番号に基づいて電話契約者の信用度を推定するコンピュータシステム
CN105404671A (zh) 一种移动终端电子记账实现方法及装置
CN108132940A (zh) 一种应用程序数据提取方法及装置
CN106126633A (zh) 贵金属数据的处理方法、装置和***
CN104299141A (zh) 数据处理方法及装置
CN107168547B (zh) 一种输入命令的方法及装置
CN109388385A (zh) 用于应用开发的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200922

Address after: Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200922

Address after: Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: Grand Cayman Islands

Patentee before: Alibaba Group Holding Ltd.