CN107577706B - 用户行为数据处理方法、装置及计算机可读存储介质 - Google Patents

用户行为数据处理方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN107577706B
CN107577706B CN201710636447.1A CN201710636447A CN107577706B CN 107577706 B CN107577706 B CN 107577706B CN 201710636447 A CN201710636447 A CN 201710636447A CN 107577706 B CN107577706 B CN 107577706B
Authority
CN
China
Prior art keywords
data
user behavior
row data
preset
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710636447.1A
Other languages
English (en)
Other versions
CN107577706A (zh
Inventor
邵雷锋
谷峰
王红艳
杨东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201710636447.1A priority Critical patent/CN107577706B/zh
Priority to US16/305,391 priority patent/US11122142B2/en
Priority to PCT/CN2017/104101 priority patent/WO2019019351A1/zh
Priority to SG11201902726SA priority patent/SG11201902726SA/en
Publication of CN107577706A publication Critical patent/CN107577706A/zh
Application granted granted Critical
Publication of CN107577706B publication Critical patent/CN107577706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1036Load balancing of requests to servers for services different from user content provisioning, e.g. load balancing across domain name servers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种用户行为数据处理方法,包括以下步骤:定时获取预设服务器中存储的日志信息;确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;将满足预设格式的所述行数据设置为用户行为信息;按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。本发明还公开了一种用户行为数据处理装置及计算机可读存储介质。本发明用HADOOP大数据平台定时对日志信息进行获取,避免了HADOOP大数据平台实时对数据进行处理,减少了处理次数,进而减小了HADOOP数据大平台的运行压力。

Description

用户行为数据处理方法、装置及计算机可读存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户行为数据处理方法、装置及计算机可读存储介质。
背景技术
随着互联网用户人数用户日益增长,用户行为分析已成为互联网领域的重要方法之一,而且操作行为的记录与分析,对产品发展至关重要。
目前,对用户行为进行分析是通过客户端抓取数据,并实时将抓取到的数据上传到WEB服务器,在接收到客户端上传的数据时,WEB服务器将该数据上传至数据库服务器;在接收到WEB服务器上传的数据时,数据库服务器对接收到的数据进行处理,以根据该数据进行用户行为的分析。
但是,由于数据库服务器需要对接收到的数据进行实时处理,造成数据库服务器进行数据处理次数较多,导致数据库服务器处理压力较大,影响数据库服务器的处理效率。
发明内容
本发明的主要目的在于提供用户行为数据处理方法、装置及计算机可读存储介质,旨在解决对用户行为进行分析的过程中数据库服务器处理压力较大而影响数据库服务器处理效率的技术问题。
为实现上述目的,本发明提供一种用户行为数据处理方法,所述技术方法包括以下步骤:
定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据;
确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;
将满足预设格式的所述行数据设置为用户行为信息;
按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。
优选地,所述将满足预设格式的所述行数据设置为用户行为信息的步骤包括:
确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;
在满足预设格式的所述行数据中存在满足预设权限的行数据时,将满足预设权限的所述行数据设置为用户行为信息。
优选地,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据的步骤包括:
在满足预设格式的所述行数据中,获取包括预设字符或预设字符串的行数据;
对包括预设字符或预设字符串的所述行数据中,预设字符或预设字符串后的第一个单词进行权限验证操作,以获得验证通过的行数据,其并将验证通过的行数据设置为满足预设权限的行数据。
优选地,将满足预设格式的所述行数据设置为用户行为信息的步骤包括:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;
将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息。
优选地,将满足预设格式的所述行数据设置为用户行为信息的步骤还包括:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;
将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
优选地,按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息的步骤包括:
将所述用户行为信息加载到数据库表;
基于所述数据库表对所述用户行为信息按照预设规则进行数据统计,以获得所述用户行为信息的统计信息。
优选地,按照预设规则对所述用户行为数据进行数据统计的步骤之后,所述用户行为数据处理方法还包括:
获取所述用户行为信息的属性信息;
显示所述属性信息和所述统计信息。
此外,为实现上述目的,本发明还提供一种日志数据的处理装置,用户行为数据处理装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户行为数据处理程序,所述用户行为数据处理程序被所述处理器执行时实现用户行为数据处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有用户行为数据处理程序,所述用户行为数据处理程序被处理器执行时实现用户行为数据处理方法的步骤。
本发明通过定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据,接着确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据,然后将满足预设格式的所述行数据设置为用户行为信息,最后按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。采用HADOOP大数据平台定时对日志信息进行获取,避免了HADOOP大数据平台实时对数据进行处理,减少了处理次数,进而减小了HADOOP数据大平台的运行压力,同时,通过HADOOP数据大平台对日志信息的清洗操作,减少了数据处理量,提高了HADOOP数据大平台数据处理效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中用户行为数据处理装置所属终端的结构示意图;
图2为本发明用户行为数据处理方法第一实施例的流程示意图;
图3为本发明用户行为数据处理方法第二实施例中将满足预设格式的所述行数据设置为用户行为信息的步骤的细化流程示意图;
图4为本发明用户行为数据处理方法第三实施例中确定满足预设格式的所述行数据中是否存在满足预设权限步骤的细化流程示意图;
图5为本发明用户行为数据处理方法第四实施例中将满足预设格式的所述行数据设置为用户行为信息步骤的细化流程示意图;
图6为本发明用户行为数据处理方法第五实施例中将满足预设格式的所述行数据设置为用户行为信息步骤的细化流程示意图;
图7为本发明用户行为数据处理方法第六实施例中对按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息步骤的细化流程示意图;
图8为本发明用户行为数据处理方法第七实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1是本发明实施例方案涉及的硬件运行环境中用户行为数据处理装置所属终端的结构示意图;
本发明实施例终端可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及用户行为数据处理程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的用户行为数据处理程序。
在本实施例中,用户行为数据处理装置包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的用户行为数据处理程序,其中,处理器1001调用存储器1005中存储的用户行为数据处理程序时,执行以下操作:
定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据;
确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;
将满足预设格式的所述行数据设置为用户行为信息;
按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。
进一步地,处理器1001可以调用存储器1005中存储的用户行为数据处理程序,还执行以下操作:
确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;
将满足预设权限的所述行数据设置为用户行为信息。
进一步地,处理器1001可以调用存储器1005中存储的用户行为数据处理程序,还执行以下操作:
在满足预设格式的所述行数据中,获取包括预设字符或预设字符串的行数据;
对包括预设字符或预设字符串的所述行数据中,预设字符或预设字符串后的第一个单词进行权限验证操作,以获得验证通过的行数据,并将验证通过的行数据设置为满足预设权限的行数据。
进一步地,处理器1001可以调用存储器1005中存储的用户行为数据处理程序,还执行以下操作:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;
将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息。
进一步地,处理器1001可以调用存储器1005中存储的用户行为数据处理程序,还执行以下操作:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;
将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
进一步地,处理器1001可以调用存储器1005中存储的用户行为数据处理程序,还执行以下操作:
将所述用户行为信息加载到数据库表;
基于所述数据库表对所述用户行为信息按照预设规则进行数据统计,以获得所述用户行为信息的统计信息。
进一步地,处理器1001可以调用存储器1005中存储的用户行为数据处理程序,还执行以下操作:
获取所述用户行为信息的属性信息;
显示所述属性信息和所述统计信息。
本发明进一步提供一种用户行为数据处理方法。参照图2,图2为本发明用户行为数据处理方法第一实施例的流程示意图。
在本实施例中,该用户行为数据处理方法包括:
步骤S100,定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据;
其中,预设服务器包括文件服务器、应用程序服务器、WEB服务器等。具体地,文件服务器具有储存文件、向其他服务器或者客户端提供文件浏览等功能,应用程序服务器用于为对应的客户端提供应用程序的后台支持服务,WEB服务器用于为对应的客户端提供网页的后台支持服务。本实施例的用户行为数据处理方法可应用于分布式数据库表基础架构平台即Hadoop大数据。平台
在本实施例中,为了获得用户行为数据,可在预设服务器所提供的文件、应用程序或网页中嵌入用户行为数据的抓取脚本。以网页为例,在客户端显示WEB服务器对应的预设网页时,客户端运行该预设网页中所嵌入的用户行为数据的抓取脚本,然后将抓取到的用户行为数据发送到该预设服务器,预设服务器将获取到的用户行为数据存储至日志信息中,HADOOP大数据平台定时获取预设服务器所存储的日志信息。其中,抓取到的用户行为数据包括:抓取用户输入的数据、光标停留时间超过一定时间时所对应的数据、用户点击界面按钮所对应的数据等,其中,在预设服务器存储上述用户行为数据时,每一组用户行为数据的起始标识与结尾标识都位于同一行。
例如,所需要的数据为用户点击界面的按钮所对应的数据时,可以在预设服务器中嵌入用户点击界面按钮所对应的数据的抓取脚本,客户端运行该预设服务器中嵌入用户点击界面按钮所对应的数据的抓取脚本,然后将抓取到的用户点击界面按钮所对应的数据发送到预设服务器,预设服务器将获取到的用户点击界面按钮所对应的数据储存在日志信息中。
在本实施例中,是由HADOOP大数据平台直接定时获取预设服务器所储存的日志信息,优选地,HADOOP大数据平台可定时获取预设时间段内预设服务器存储的日志信息,或者,定时获取前一获取时刻至当前时刻之间预设服务器存储的日志信息。例如,定时获取的时刻为上午8点钟,预设时间段为一天,HADOOP则会在今天上午8点钟,获取昨天上午8点钟之后至今天上午8点钟之间预设服务器所存储的日志信息。其中,定时获取的时间间隔可以根据实际需求进行合理的设置,例如,该时间间隔可设置为1小时、1天等,本实施例中不做具体限定。
优选地,在当前时刻达到定时获取预设服务器所存储的日志信息所对应的时刻时,HADOOP大数据平台与预设服务器之间建立通信连接,在每次成功获取到预设服务器所存储的日志信息时,可断开HADOOP大数据平台与预设服务器之间的通信连接,进而避免在HADOOP大数据平台与预设服务器之间无数据传输时仍处于通信状态,以提高预设服务器的带宽资源利用率。
步骤S200,确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;
其中,预设格式可以是用户行为的日志信息对应的预设服务器储存格式,在预设服务器中,可以对不同的日志信息采用不同的文本格式进行存储。用户行为数据可以是以字符串dpmp_log:开头的行数据、以字符串dpmp_log:结尾的行数据、以其他字符或字符串结尾或开头的行数据等,例如,当预设格式是以字符串dpmp_log:开头的行数据时,用户对某个应用程序的某个界面进行点击访问,客户端则会按照定制化脚本对该用户的行为数据进行抓取,将抓取到的行为数据储存在预设服务器中的日志信息中,HADOOP大平台定时获取该日志信息,然后在HADOOP大数据平台中,确定该日志信息是否为满足预设格式的行数据,即该日志信息所对应的行数据是否为以预设字符或预设字符串开头的行数据,即以字符串dpmp_log:开头的行数据,当满足以字符串dpmp_log:开头的行数据时,则日志信息所对应的行数据为满足预设格式的行数据。
在其他实施例中,可采用多种方式对获取到的所述日志信息进行清洗,以得到日志信息中与用户行为相关的数据,例如,首先在HADOOP大数据平台获取的日志信息中筛选出满足预设格式的信息,然后根据设定的预设条件层层筛选,以得到符合预设条件的信息数据,预设条件包括:信息数据中的格式、符号、满足公式、字符后单词个数等限定要求,通过这些预设条件的筛选,最终清楚、快速地得到满足条件的信息数据;具体地,首先获取所述日志信息的各个行数据中满足预设格式的行数据,然后获取满足预设格式的所述行数据中满足预设权限的行数据,在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据,在包括预设字符或预设字符串的所述行数据中,对预设字符或预设字符串后的第一个单词进行权限验证操作,再判断日志文件行数据中以预设字符或预设字符串分隔后第二个单词是否为操作人员信息,最后确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据,获得的小于预设阈值的行数据即为用户行为信息,其中,上述清洗操作中的各个步骤的顺序可以任意排序以及组合。
步骤S300,将满足预设格式的所述行数据设置为用户行为信息;在本实施例中,在日志信息的各个行数据中存在满足预设格式的行数据时,则将满足预设格式的行数据设置为用户行为信息,用户行为数据往往涉及多个方面,用户行为信息是需要进行分析或统计的特定方面的用户行为数据,例如,当预设格式是以字符串dpmp_log:开头时,用户对某个应用程序的某个界面进行点击访问,客户端则会按照定制化脚本对该用户的行为数据进行抓取,将抓取到的行为数据储存在预设服务器中的日志信息中,HADOOP大平台定时获取该日志信息,然后在HADOOP大数据平台中,确定该日志信息所对应的行数据中是否存在以字符串dpmp_log:开头的行数据,当日志信息所对应的行数据中存在以字符串dpmp_log:开头的行数据时,则将该行数据设置为用户行为信息,其中,将行数据设置为用户行为信息包括在数据库中预留一个存储空间命名为用户行为信息库,将该行数据保存在这个用户行为信息库,或者直接将该满足预设格式的行数据命名为用户行为信息。
步骤S400,按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。
其中,数据统计包括:统计清洗后的数据中某一固定信息出现的次数、功能点出现的次数、用户输入的数据、光标停留时间超过一定时间时所对应的数据、用户点击界面的按钮所对应的数据。当用户访问预设网页时,客户端运行预设服务器对应的该预设网页中所嵌入的用户行为数据的抓取脚本,然后将抓取到的用户行为数据发送到该预设服务器,预设服务器将获取到的用户行为数据存储至日志信息中,再由HADOOP数据大平台定时获取预设服务器存储的日志信息,然后对定时获取到的日志信息进行清洗操作,最后对用户行为数据进行统计与分析。例如,所需要得到投资理财类用户行为的日志信息,用户在访问与投资理财相关网页时,客户端按照定制化脚本对投资理财相关网页留下的访问行为数据进行抓取,同时,将抓取的行为数据储存在预设服务器中的日志信息中,然后HADOOP数据大平台定时获取预设服务器中储存的日志信息,再然后在HADOOP大数据平台中对获取的日志信息进行清洗操作,最后对清洗操作后的日志信息数据进行统计分析。其中,可以统计访问该网页的所有用户数量,该用户数量就是所述某一固定信息出现的次数一种表现形式。
其中,用户行为信息是按一定的预设规则进行统计,按预设规则进行统计可以按统计标识进行统计。例如,统计清洗后的数据中某一固定信息出现的次数或者功能点出现的次数,还可以统计用户输入的某一数据的时间排序,还可以统计光标停留时间超过一定时间时所对应的数据的具体停留时间,还可以统计用户点击界面的按钮所对应的数据的具体内容。
在本实施例中,进行数据统计的目的是为了将清洗后得到的数据信息按一定预设规则进行排列与显示,因此需对清洗后的数据信息进行数据统计。其中,统计信息是指预设规则统计得到的信息和该信息的属性信息。在本实施例中,统计得到的信息包括:用户数量、网页浏览量、APP用户注册量及排名等,属性信息包括:信息名称、页面网址、时间、信息类别等。
本实施例提出的用户行为数据处理方法,通过定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据,接着确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据,然后将满足预设格式的所述行数据设置为用户行为信息,最后按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。采用HADOOP大数据平台定时对日志信息进行获取,避免了HADOOP大数据平台实时对数据进行处理,减少了处理次数,进而减小了HADOOP数据大平台的运行压力,同时,通过HADOOP数据大平台对日志信息的清洗操作,减少了数据处理量,提高了HADOOP数据大平台数据处理效率。
基于第一实施例,提出本发明用户行为数据处理方法的第二实施例,参照图3,在本实施例中,步骤S300包括:
步骤S310,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;
在本实施例中,确定满足预设格式的行数据中是否存在满足预设权限的行数据是指,满足预设格式的行数据中包括该预设权限所对应的权限信息,例如,在预设权限所对应的权限信息包括多个信息(例如字符串)时,满足预设格式的行数据中只要包括权限信息中的一个字符串,即可确定该行数据中为满足预设权限的行数据,即满足预设格式的所述行数据中存在满足预设权限的行数据。
例如,日志信息是2016年金融投资类的用户网页浏览量,该日志信息对应的行数据中包括网页浏览记录的存储格式、金融投资类固定存储字符或者、浏览时间对应的数字等不同的数据信息的表现形式,根据所需要的对应数据信息的表现形式设置格式要求、字符要求、数字要求或公式等,即设置权限信息,根据权限信息进行筛选出包括预设权限所对应的权限信息的行数据,即得到满足预设权限的行数据。
步骤S320,将满足预设权限的所述行数据设置为用户行为信息;
在本实施例中,首先满足预设格式的行数据中是否存在满足预设权限的行数据,将满足预设权限的行数据设置为用户行为信息。
本实施例提出的用户行为数据处理方法,通过确定满足预设格式的所述行数据中是否存在满足预设权限的行数据,然后将满足预设权限的所述行数据设置为用户行为信息,能够根据预设权限在满足预设格式的所述行数据中准确、快速地筛选出用户行为对应的日志信息,实现了日志信息对进一步筛选,以避免对日志信息中与用户行为不相关的数据进行分析处理,进一步减小了进行用户行为分析的数据量,提高了HADOOP的处理效率。
基于第二实施例,提出本发明用户行为数据处理方法的第三实施例,参照图4,在本实施例中,步骤S310包括:
步骤S311,在满足预设格式的所述行数据中,获取包括预设字符或预设字符串的行数据;
在本实施例中,预设字符或预设字符串包括单词、字母、数字、符号等,例如,预设字符包括α、%等,预设字符串包括$$、mm等。不同种类的日志信息所对应的行数据中包含的字符或者字符串一般都不同,所对应的行数据中可以包括多个字符或者字符串,也可以是字符和字符串的组合。例如,当预设字符为α,满足预设格式的行数据中包含α时,则对应的行数据满足预设字符要求:或者,当预设字符串为$$,满足预设格式的行数据中包含$$时,则对应的行数据满足预设字符串要求;或者,当预设字符为α,预设字符串为$$,满足预设格式的行数据中既包含α又包含$$时,则对应行数据同时满足预设字符和字符串要求。
步骤S312,对包括预设字符或预设字符串的所述行数据中,对预设字符或预设字符串后的第一个单词进行权限验证操作,以获得验证通过的行数据,并将验证通过的行数据设置为满足预设权限的行数据;
在本实施例中,首先获取包含预设格式的日志信息对应的行数据,然后筛选出日志信息中包含的预设字符或预设字符串的行数据,最后对预设字符或预设字符串后的第一个单词进行权限验证操作,例如,当预设字符串为$$时,判断满足预设格式的行数据中以$$分隔后首单词是否与权限信息一致,最后筛选出以$$分隔后首单词与权限信息一致的行数据即满足权限的行数据。当然,满足权限可以是$$分隔后或者前第一、第二、第三等不同位置的单词,也可以是不同符号、数字等字符或者字符串分隔后或者前第一、第二、第三等不同位置的单词。
本实施例提出的用户行为数据处理方法,通过在满足预设格式的所述行数据中,获取包括预设字符或预设字符串的行数据,对包括预设字符或预设字符串的所述行数据中,预设字符或预设字符串后的第一个单词进行权限验证操作,以获得验证通过的行数据,并将验证通过的行数据设置为满足预设权限的行数据,通过对满足预设格式的行数据进行权限验证,能够准确、快速地筛选出用户行为对应的日志信息,实现了对日志信息进一步筛选,以避免对日志信息中与用户行为不相关的数据进行分析处理,进一步减小了进行用户行为分析的数据量,提高了HADOOP的处理效率。
基于第一实施例,提出本发明用户行为数据处理方法的第四实施例,参照图5,在本实施例中,步骤S300还包括:
步骤S330,在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
在本实施例中,预设字符或预设字符串包括单词、字母、数字、符号等,例如,预设字符包括α、%等,预设字符串包括$$、mm等。不同种类用户行为的日志信息所对应的行数据中包含的字符或者字符串一般都不同,所对应的行数据中可以包括多个字符或者字符串,也可以是字符和字符串的组合。例如,当预设字符为α,满足预设格式的行数据中包含α时,则对应的行数据满足预设字符要求;或者,当预设字符串为$$,满足预设格式的行数据中包含¥¥时,则对应的行数据满足预设字符串要求;或者,当预设字符为α,预设字符串为$$,满足预设格式的行数据中既包含α又包含$$时,则对应行数据同时满足预设字符和字符串要求。
步骤S340,将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息;
在本实施例中,首先筛选获得包含有预设字符或预设字符串的行数据,然后判断日志信息对应的行数据中以预设字符或预设字符串分隔后第二个单词是否为预设信息,也可以是预设字符或预设字符串分隔后或者前第三个或者其他位置的单词,本实施例对单词位置不作具体限定。
其中,预设信息可根据用户行为数据的存储格式进行合理的设置,例如,该预设信息可以为操作人员信息,即确定包括预设字符或预设字符串的行数据中,是否存在预设字符或预设字符串后第二个单词为操作人员信息的行数据。例如,当预设字符串为$$,判断日志文件行中$$分隔后第二个单词是否为操作人员信息,具体地,可采用正则表达式:^[\w\d_-\+\.]*$判断$$分隔后第二个单词是否为操作人员信息,其中,包括预设字符或预设字符串的行数据中存在满足该正则表达式的行数据时,确定包括预设字符或预设字符串的行数据中存在预设字符或预设字符串后第二个单词为预设信息的行数据。
步骤S350,将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息;
在本实施例中,判断是否存在预设字符或者字符串后第二个单词为预设信息的行数据,该行数据存在预设字符或者预设字符串后第二个单词为预设信息时,则将该行数据设置为用户行为信息。
本实施例提出的用户行为数据处理方法,通过在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据,然后确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据,最后将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息,通过对满足预设格式的行数据的预设字符或者预设字符串后第二个单词是否为预设信息进行判断,进而能够准确、快速地筛选出用户行为对应的日志信息,实现了对日志信息进一步筛选,以避免对日志信息中与用户行为不相关的数据进行分析处理,进一步减小了进行用户行为分析的数据量,提高了HADOOP的处理效率。
基于第一实施例,提出本发明用户行为数据处理方法的第五实施例,参照图6,在本实施例中,步骤S300还包括:
步骤S360,在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
在本实施例中,预设字符或预设字符串包括单词、字母、数字、符号等,例如,预设字符包括α、%等,预设字符串包括$$、mm等。不同种类用户行为的日志信息所对应的行数据中包含的字符或者字符串一般都不同,所对应的行数据中可以包括多个字符或者字符串,也可以是字符和字符串的组合。例如,当预设字符为α,满足预设格式的行数据中包含α时,则对应的行数据满足预设字符要求;或者,当预设字符串为$$,满足预设格式的行数据中包含$$时,则对应的行数据满足预设字符串要求;或者,当预设字符为α,预设字符串为$$,满足预设格式的行数据中既包含α又包含$$时,则对应行数据同时满足预设字符和字符串要求。
步骤S370,确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;
在本实施例中,是否超过预设阈值是根据预设字符或预设字符串后单词的个数来判断的,所以首先统计包括预设字符或预设字符串的行数据中的预设字符或预设字符串后或者的个数,然后对单词的个数与预设阈值进行对比,小于预设阈值则代表该行数据经过筛选设置为用户行为信息。例如,当预设字符串为$$时,筛选出了包含$$的行数据,然后对¥¥后的单词数进行统计,包括预设字符或预设字符串的行数据中的某一行数据统计得到单词个数为n,预设阈值为m,若n<m,则该行数据则被筛选出来设置为用户行为信息。
步骤S380,将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息;
在本实施例中,在日志信息中存在预设字符或者字符串后的单词个数小于预设阈值的行数据,则将该行数据设置为用户行为信息。
本实施例提出的用户行为数据处理方法,通过在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据,然后确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据,最后将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息,通过对满足预设格式的行数据中预设字符或者字符串后的单词个数是否小于预设阈值的判断,进而能够准确、快速地筛选出用户行为对应的日志信息,实现了日志信息的进一步筛选,以避免对日志信息中与用户行为不相关的数据进行分析处理,进一步减小了进行用户行为分析的数据量,提高了HADOOP的处理效率。
在其他实施例中,上述对获取到的所述日志信息进行清洗操作的步骤可以进行任意组合。
例如,确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;在所述日志信息的各个行数据中存在满足预设格式的行数据时,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;在满足预设格式的所述行数据中存在满足预设权限的行数据时,在满足预设权限的所述行数据中,获取包括预设字符或预设字符串的行数据;确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;当存在预设字符或预设字符串后第二个单词为预设信息的行数据时,在预设字符或预设字符串后第二个单词为预设信息的行数据中,获取包括预设字符或预设字符串的行数据;确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;当存在预设字符或预设字符串后单词的个数小于预设阈值的行数据时,将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
或者,确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;在所述日志信息的各个行数据中存在满足预设格式的行数据时,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;在满足预设格式的所述行数据中存在满足预设权限的行数据时,在满足预设权限的所述行数据作中,获取包括预设字符或预设字符串的行数据;确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;当存在预设字符或预设字符串后第二个单词为预设信息的行数据时,将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息。
又或者,确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;在所述日志信息的各个行数据中存在满足预设格式的行数据时,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;在满足预设格式的所述行数据中存在满足预设权限的行数据时,在满足预设权限的所述行数据作中,获取包括预设字符或预设字符串的行数据;确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;当存在预设字符或预设字符串后单词的个数小于预设阈值的行数据时,将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
基于第一实施例,提出本发明用户行为数据处理方法的第六实施例,参照图7,在本实施例中,步骤S400包括:
步骤S410,将所述用户行为信息加载到数据库表;
在本实施例中,清洗后获得的信息数据可以加载到数据库表中,按照预设规则在数据库表中进行统计,数据库表可以是新建的数据库表,也可以是之前存在或者已使用过的数据库表。
步骤S420,基于所述数据库表对所述用户行为信息按照预设规则进行数据统计,以获得所述用户行为信息的统计信息;
在本实施例中,预设规则指的是按某种计算或者某种分类等方式进行统计,例如,清洗后的获得到的数据为某一APP界面访问行为数据,基于hive表,可以统计出该用户点击该APP界面的次数,也可以统计出访问该APP界面的时长,或者更多日志信息对应的行为数据特征,在数据库表中可以根据这些不同的数据特征进行统计,也就是按照预设规则进行统计。统计后能够清楚得到该日志信息的统计信息,其中统计信息包括统计得到的信息与对应的属性信息。
本实施例提出的用户行为数据处理方法,通过将所述用户行为信息加载到数据库表,然后基于所述数据库表对所述用户行为信息按照预设规则进行数据统计,以获得所述用户行为信息的统计信息,对日志数据的统计,能够使得到的日志信息的统计信息一目了然,便于对比与分析。
基于上述实施例,提出本发明用户行为数据处理方法的第七实施例,参照图8,在本实施例中,在步骤S3000之后,该交用户行为数据处理方法还包括:
步骤S500,获取所述用户行为信息的属性信息;
在本实施例中,日志信息都有其对应的属性信息,在HADOOP大数据平台可以直接获取清洗后得到的日志信息的属性信息,属性信息包括页面信息网址、信息名称、时间、信息类型等。
步骤S600,显示所述属性信息和所述统计信息;
在本实施例中,进行用户行为数据在数据库中按照预设规则进行统计,然后直接获取该信息数据的属性信息,该属性信息包括用户行为信息的标识信息及来源信息,该标识信息包括用户行为信息的信息类型、信息名称等,该来源信息包括该用户行为信息的来源网址信息、时间等。
在HADOOP大数据平台直接显示出行为日志数据的属性信息和统计信息。统计信息包括用户点击该APP界面的次数、访问该APP界面的时长等统计获得的数据。统计得到的日志信息在HADOOP数据大平台上直接显示,清楚明了。
本实施例提出的用户行为数据处理方法,通过获取所述用户行为信息的属性信息,然后显示所述属性信息和所述统计信息,使HADOOP数据大平台的管理人员对该日志信息的相关信息一目了然,以便于该管理人员对该日志信息进行后续的处理。
本发明还提供一种计算机可读存储介质,在本实施例中,计算机可读存储介质上存储有用户行为数据处理程序,其中:
定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据;
确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;
将满足预设格式的所述行数据设置为用户行为信息;
按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。
进一步地,该用户行为数据处理程序被所述处理器执行时,还实现如下步骤:
确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;
将满足预设权限的所述行数据设置为用户行为信息。
进一步地,该用户行为数据处理程序被所述处理器执行时,还实现如下步骤:
在满足预设格式的所述行数据中,获取包括预设字符或预设字符串的行数据;
对包括预设字符或预设字符串的所述行数据中,预设字符或预设字符串后的第一个单词进行权限验证操作,以获得验证通过的行数据,并将验证通过的行数据设置为满足预设权限的行数据。
进一步地,该用户行为数据处理程序被所述处理器执行时,还实现如下步骤:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;
将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息。
进一步地,该用户行为数据处理程序被所述处理器执行时,还实现如下步骤:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;
将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
进一步地,该用户行为数据处理程序被所述处理器执行时,还实现如下步骤:
将所述用户行为信息加载到数据库表;
基于所述数据库表对所述用户行为信息按照预设规则进行数据统计,以获得所述用户行为信息的统计信息。
进一步地,该用户行为数据处理程序被所述处理器执行时,还实现如下步骤:
获取所述用户行为信息的属性信息;
显示所述属性信息和所述统计信息。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种用户行为数据处理方法,其特征在于,所述用户行为数据处理方法包括以下步骤:
定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据;
确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;
将满足预设格式的所述行数据设置为用户行为信息;
按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息;
其中,所述将满足预设格式的所述行数据设置为用户行为信息的步骤包括:
在所述日志信息的各个行数据中存在满足预设格式的行数据时,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;
在满足预设格式的所述行数据中存在满足预设权限的行数据时,在满足预设权限的所述行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;
当存在预设字符或预设字符串后第二个单词为预设信息的行数据时,在预设字符或预设字符串后第二个单词为预设信息的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;
当存在预设字符或预设字符串后单词的个数小于预设阈值的行数据时,将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
2.如权利要求1所述的用户行为数据处理方法,其特征在于,所述将满足预设格式的所述行数据设置为用户行为信息的步骤包括:
确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;
将满足预设权限的所述行数据设置为用户行为信息。
3.如权利要求2所述的用户行为数据处理方法,其特征在于,所述确定满足预设格式的所述行数据中是否存在满足预设权限的行数据的步骤包括:
在满足预设格式的所述行数据中,获取包括预设字符或预设字符串的行数据;
对包括预设字符或预设字符串的所述行数据中,预设字符或预设字符串后的第一个单词进行权限验证操作,以获得验证通过的行数据,并将验证通过的行数据设置为满足预设权限的行数据。
4.如权利要求1所述的用户行为数据处理方法,其特征在于,所述将满足预设格式的所述行数据设置为用户行为信息步骤包括:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;
将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息。
5.如权利要求1所述的用户行为数据处理方法,其特征在于,所述将满足预设格式的所述行数据设置为用户行为信息的步骤包括:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;
将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
6.如权利要求1所述的用户行为数据处理方法,其特征在于,所述按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息的步骤包括:
将所述用户行为信息加载到数据库表;
基于所述数据库表对所述用户行为信息按照预设规则进行数据统计,以获得所述用户行为信息的统计信息。
7.如权利要求1-6中任一所述的用户行为数据处理方法,其特征在于,所述按照预设规则对所述用户行为信息进行数据统计的步骤之后,所述用户行为数据处理方法还包括:
获取所述用户行为信息的属性信息;
显示所述属性信息和所述统计信息。
8.如权利要求7所述的用户行为数据处理方法,其特征在于,所述属性信息包括所述用户行为信息的标识信息及来源信息。
9.一种用户行为数据处理装置,其特征在于,所述用户行为数据处理装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户行为数据处理程序,所述用户行为数据处理程序被所述处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有用户行为数据处理程序,所述用户行为数据处理程序被处理器执行时实现如权利要求1至8中任一项所述的用户行为数据处理方法步骤。
CN201710636447.1A 2017-07-28 2017-07-28 用户行为数据处理方法、装置及计算机可读存储介质 Active CN107577706B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201710636447.1A CN107577706B (zh) 2017-07-28 2017-07-28 用户行为数据处理方法、装置及计算机可读存储介质
US16/305,391 US11122142B2 (en) 2017-07-28 2017-09-28 User behavior data processing method and device, and computer-readable storage medium
PCT/CN2017/104101 WO2019019351A1 (zh) 2017-07-28 2017-09-28 用户行为数据处理方法、装置及计算机可读存储介质
SG11201902726SA SG11201902726SA (en) 2017-07-28 2017-09-28 User behavior data processing method and device, and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710636447.1A CN107577706B (zh) 2017-07-28 2017-07-28 用户行为数据处理方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107577706A CN107577706A (zh) 2018-01-12
CN107577706B true CN107577706B (zh) 2019-09-20

Family

ID=61034349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710636447.1A Active CN107577706B (zh) 2017-07-28 2017-07-28 用户行为数据处理方法、装置及计算机可读存储介质

Country Status (4)

Country Link
US (1) US11122142B2 (zh)
CN (1) CN107577706B (zh)
SG (1) SG11201902726SA (zh)
WO (1) WO2019019351A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577706B (zh) * 2017-07-28 2019-09-20 平安科技(深圳)有限公司 用户行为数据处理方法、装置及计算机可读存储介质
CN110135182B (zh) 2018-02-02 2023-09-29 微软技术许可有限责任公司 用户行为数据标记
CN108595510A (zh) * 2018-03-22 2018-09-28 成都数聚城堡科技有限公司 一种基于浏览器端的爬虫、分布式爬虫***及方法
CN109408105A (zh) * 2018-09-25 2019-03-01 腾讯科技(武汉)有限公司 用户行为数据的采集方法、装置、计算装置和存储介质
CN109947821B (zh) * 2019-03-14 2023-01-06 腾讯科技(深圳)有限公司 报告信息的生成方法、显示方法、装置、设备及存储介质
CN110245063B (zh) * 2019-06-25 2023-01-31 北京搜房科技发展有限公司 用户行为统计方法及装置
CN110837528A (zh) * 2019-11-15 2020-02-25 智慧足迹数据科技有限公司 人口统计方法、装置及服务器
CN111274217B (zh) * 2020-01-10 2023-08-18 深圳前海环融联易信息科技服务有限公司 数据采集的方法、装置、计算机设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101272276A (zh) * 2008-04-22 2008-09-24 深圳国人通信有限公司 一种日志管理的实现方法
CN104951517A (zh) * 2015-05-29 2015-09-30 小米科技有限责任公司 行为日志统计方法及装置
CN106940679A (zh) * 2017-02-23 2017-07-11 中科创达软件股份有限公司 数据处理方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08167006A (ja) * 1994-12-13 1996-06-25 Canon Inc 自然言語処理装置及びその方法
US7707189B2 (en) * 2004-10-05 2010-04-27 Microsoft Corporation Log management system and method
US7689455B2 (en) * 2005-04-07 2010-03-30 Olista Ltd. Analyzing and detecting anomalies in data records using artificial intelligence
US9407662B2 (en) * 2005-12-29 2016-08-02 Nextlabs, Inc. Analyzing activity data of an information management system
JP5850224B2 (ja) * 2011-02-28 2016-02-03 株式会社リコー 管理システム、及びプログラム
CN103166827A (zh) 2011-12-09 2013-06-19 北京神州泰岳软件股份有限公司 用户行为数据上报方法和***
CN103309884A (zh) 2012-03-13 2013-09-18 阿里巴巴集团控股有限公司 用户行为数据采集方法及***
CN102946319B (zh) * 2012-09-29 2015-12-16 焦点科技股份有限公司 网络用户行为信息分析***及其分析方法
US11231973B2 (en) * 2017-07-18 2022-01-25 Sap Se Intelligent business logging for cloud applications
CN107577706B (zh) 2017-07-28 2019-09-20 平安科技(深圳)有限公司 用户行为数据处理方法、装置及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101272276A (zh) * 2008-04-22 2008-09-24 深圳国人通信有限公司 一种日志管理的实现方法
CN104951517A (zh) * 2015-05-29 2015-09-30 小米科技有限责任公司 行为日志统计方法及装置
CN106940679A (zh) * 2017-02-23 2017-07-11 中科创达软件股份有限公司 数据处理方法及装置

Also Published As

Publication number Publication date
CN107577706A (zh) 2018-01-12
SG11201902726SA (en) 2019-05-30
US20200244759A1 (en) 2020-07-30
US11122142B2 (en) 2021-09-14
WO2019019351A1 (zh) 2019-01-31

Similar Documents

Publication Publication Date Title
CN107577706B (zh) 用户行为数据处理方法、装置及计算机可读存储介质
US11637797B2 (en) Automated image processing and content curation
US11354702B2 (en) Generating interactive advertising with content collections
US10270839B2 (en) Content collection navigation and autoforwarding
US10162891B2 (en) Determining demographics based on user interaction
US20210158389A1 (en) Interactive advertising with media collections
CN104360882B (zh) 一种浏览器中对网页中图片进行显示方法和装置
CN109948077A (zh) 用户行为数据采集方法、装置、设备和计算机存储介质
CN109416805A (zh) 用于具有自动广告的媒体集的呈现的方法和***
CN106233282A (zh) 使用设备能力的应用搜索
US11601391B2 (en) Automated image processing and insight presentation
CN109074390A (zh) 用于媒体集的生成、策展和呈现的方法和***
CN109754316A (zh) 产品推荐方法、产品推荐***及存储介质
CN108134961A (zh) 视频过滤方法、移动终端及计算机可读存储介质
CN108305057A (zh) 电子红包的发放装置、方法及计算机可读存储介质
CN105893584A (zh) 一种显示收藏夹网址标签的方法、客户端和***
CN107707602A (zh) 数据通信处理终端、方法及计算机可读存储介质
CN115809889A (zh) 基于营销效果的智能客群筛选方法、***、介质及设备
CN107437174A (zh) 虚拟卡片管理方法和装置
CN111885139B (zh) 内容分享方法、装置及***、移动终端、服务器
CN105956050B (zh) 一种数据收集方法、装置及设备
CN107315634A (zh) 分身应用策略处理方法、移动终端及可读存储介质
CN112243156B (zh) 弹幕显示方法和装置及存储介质
CN107688559A (zh) 提示信息的显示方法、装置及计算机可读存储介质
CN105027111A (zh) 客观的应用评价

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1248871

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant