CN102737019B

CN102737019B - 机器行为确定方法、网页浏览器及网页服务器

Info

Publication number: CN102737019B
Application number: CN201110081101.2A
Authority: CN
Inventors: 侯欣杰; 叶敏; 向涛
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2011-03-31
Filing date: 2011-03-31
Publication date: 2016-08-24
Anticipated expiration: 2031-03-31
Also published as: TWI515588B; JP2014510979A; TW201239655A; EP2691848A4; US20130042306A1; WO2012135519A1; EP2691848B1; CN102737019A; EP2691848A1; JP6347487B2

Abstract

本申请公开了一种机器行为确定方法、网页浏览器及网页服务器，该方法包括步骤：网页浏览器在用户访问网页时，获得所述用户针对所述网页的操作行为信息；以及将获得的操作行为信息发送给网页服务器；网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值；并在判断出所述机器行为权重值不小于规定阈值时，确定所述用户针对所述网页的操作行为为机器行为。采用本申请技术方案，解决了现有技术存在的确定机器行为时的准确性较低的问题。

Description

机器行为确定方法、网页浏览器及网页服务器

技术领域

本申请涉及互联网信息处理技术领域，尤其涉及一种机器行为确定方法、网页浏览器及网页服务器。

背景技术

随着互联网技术的不断发展，越来越多的信息资源选择网络作为传播的载体，用户可以通过网页浏览器来访问各网页中的信息，现有技术中，用户通过网页浏览器对网页进行访问的方法如图1所示，其具体处理流程如下：

步骤11，用户在网页浏览器中输入需要访问的网页对应的网址信息，确认访问，相当于向网页浏览器发送访问请求，访问请求中携带有上述网址信息；

步骤12，网页浏览器在接收到的访问请求中加入该用户的互联网协议(IP，Internet Protocol)地址信息，然后发送给对应的网页服务器；

步骤13，网页服务器根据该访问请求中携带的网址信息，查找该网页的网页代码；

步骤14，网页服务器根据用户的IP地址信息，将查找到的网页代码发送给该网页浏览器；

步骤15，网页浏览器根据接收到的网页代码，为用户提供该网页的页面内容。

用户在访问网页时，可以通过网页浏览器浏览网页中的信息，也可以进行注册、登录、发帖、回复等操作，若用户打开的网页为网站提供的用于进行用户注册的网页，则如图2所示，为用户通过网页浏览器进行注册操作的方法流程图，其具体处理流程如下：

步骤21，用户在用于注册的网页中输入用户名和密码等注册信息，其中在用户名输入框中输入需注册的用户名，在密码输入框中输入设置的密码；

步骤22，用户在完成用户名和密码等注册信息的输入后，确认注册，相当于向网页浏览器发送注册请求，该注册请求中包含用户输入的注册信息以及该网页对应的网址信息；

步骤23，网页浏览器根据该注册请求中的网址信息，将该注册请求发送给对应的网页服务器；

步骤24，网页服务器对注册请求中携带的注册信息进行验证，若通过验证，则转至步骤25，若不通过验证，则转至步骤27；

步骤25，网页服务器将注册成功提示网页的网页代码发送给网页浏览器；

步骤26，网页浏览器根据接收到的网页代码，为用户提供注册成功提示网页的页面内容，该页面内容中包含注册成功提示信息；

步骤27，网页服务器将注册失败提示网页的网页代码发送给网页浏览器；

步骤28，网页浏览器根据接收到的网页代码，为用户提供注册失败提示网页的页面内容，该页面内容中包含注册失败提示信息，以及注册失败原因信息。

现有技术中，某些用户为了获取网站积分，或者为了在网站中发布广告或恶意信息，可能会使用软件程序模拟人的操作，来进行恶意注册、恶意登录、恶意发帖、恶意回复等操作，例如，用户启动恶意注册软件程序后，该软件程序会模拟人的操作，在用户注册的网页中输入随机生成的注册信息，然后点击注册，其中，由软件程序模拟人的操作所产生的操作行为也可以称为机器行为。

若网页服务器不能鉴别用户针对网页的操作行为是否为机器行为，则网页服务器就会对机器行为产生的各种操作请求(注册请求、登录请求、发帖请求、回复请求等)进行相应处理，这就耗费了网页服务器较多的处理资源，降低了网页服务器的处理效率，此外，网页服务器中也会产生大量的恶意行为数据，占用了网页服务器较多的存储资源。

针对上述问题，现有技术提出在接收到用户的某些操作请求(注册请求、登录请求、发帖请求、回复请求等)后，会判断用户的操作行为是否为机器行为，若判断出为机器行为，则不对这些操作请求进行处理。现有技术一般通过下述两种方法确定机器行为，下面分别进行介绍。

第一种方法，IP地址分析方法，若相同的IP地址在很短的时间内连续发送了多个指定操作请求(例如注册请求)，则认为用户针对网页的操作行为很可能是机器行为；

上述第一种方法主要根据用户的IP地址确定机器行为，由于IP地址可以实现快速更换，因此就不能准确地确定出频繁更换IP地址的机器行为，从而使得确定机器行为的准确性较低。

第二种方法，操作信息分析方法，对用户的指定操作请求中的操作信息进行分析，若指定操作请求为注册请求，那么注册请求中的注册信息就为操作信息，若分析得出用户的多个指定操作请求中的操作信息之间存在一定的特征规律，则认为用户针对网页的操作行为很可能是机器行为。例如，用户A通过网页浏览器向网页服务器发送了4次注册请求，第1次发送的注册请求中包含的注册用户名(注册信息)为“ABCDE”，第2次发送的注册请求中包含的注册用户名为“ABCDF”，第3次发送的注册请求中包含的注册用户名为“ABCDG”，第4次发送的注册请求中包含的注册用户名为“ABCDH”，网页服务器通过分析上述4个注册用户名得知，上述4个注册用户名中的前四位均为“ABCD”，区别只在于最后一位不同，网页服务器认为这4个注册用户名之间是存在明显规律的，因此认为用户A针对网页的注册行为为机器行为。

在上述第二种方法中，由于很多恶意软件能够实现操作信息的随机生成，例如，用户使用用户名随机生成软件生成每次进行注册的注册用户名，生成的各注册用户名之间不存在明显的规律，那么网页服务器就无法确定该用户的注册行为是否为机器行为，因此确定机器行为的准确性也比较低。

由上可见，现有技术在确定机器行为时的准确性较低。

发明内容

本申请实施例提供一种机器行为确定方法、网页浏览器及网页服务器，用以解决现有技术中存在的确定机器行为时的准确性较低的问题。

本申请实施例技术方案如下：

一种机器行为确定方法，该方法包括步骤：网页浏览器在用户访问网页时，获得所述用户针对所述网页的操作行为信息；以及将获得的操作行为信息发送给网页服务器；网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值；并在判断出所述机器行为权重值不小于规定阈值时，确定所述用户针对所述网页的操作行为为机器行为。

一种网页浏览器，包括：获得单元，用于在用户访问网页时，获得所述用户针对所述网页的操作行为信息；发送单元，用于将获得单元获得的操作行为信息发送给网页服务器。

一种网页服务器，包括：第一接收单元，用于接收网页浏览器发送的、用户针对网页的操作行为信息；第一确定单元，用于根据第一接收单元接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值；第一判断单元，用于判断第一确定单元确定出的所述机器行为权重值是否小于规定阈值；第二确定单元，用于在第一判断单元的判断结果为否时，确定所述用户针对所述网页的操作行为为机器行为。

本申请实施例技术方案中，网页浏览器在用户访问网页时，获得所述用户针对所述网页的操作行为信息，以及将获得的操作行为信息发送给网页服务器，网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值，并在判断出所述机器行为权重值不小于规定阈值时，确定所述用户针对所述网页的操作行为为机器行为，由上可见，本申请实施例技术方案不再通过IP地址分析方法或操作信息分析方法来确定机器行为，而是通过用户针对网页的操作行为来判断用户针对网页的操作行为是否为机器行为，这就有效地提高了确定机器行为的准确性，使得网页服务器能够准确地鉴别出机器行为，进而不对机器行为产生的各种操作请求(注册请求、登录请求、发帖请求、回复请求等)进行相应地处理，节省了网页服务器较多的处理资源，提高了网页服务器的处理效率，节省了网页服务器较多的存储资源。

附图说明

图1为现有技术中，用户通过网页浏览器对网页进行访问的方法流程示意图；

图2为现有技术中，用户通过网页浏览器进行注册操作的方法流程示意图；

图3为本申请实施例一中，机器行为确定方法流程示意图；

图4为本申请实施例一中，机器行为识别分析模型示意图；

图5为本申请实施例二中，机器行为确定方法具体实现流程示意图；

图6为本申请实施例三中，网页浏览器结构示意图；

图7为本申请实施例四中，网页服务器结构示意图。

具体实施方式

下面结合各个附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。

实施例一

如图3所示，为本申请实施例一中，机器行为确定方法流程图，其具体处理过程如下：

步骤31，网页浏览器在用户访问网页时，获得所述用户针对所述网页的操作行为信息；

其中，用户针对网页的操作行为信息是指用户在该网页中进行的各种操作行为的信息，例如滑动鼠标，使用键盘输入操作信息等，用户的操作行为信息包含鼠标操作信息、键盘操作信息和操作流程信息等，鼠标操作信息包含鼠标按键坐标信息、鼠标按键时间信息和鼠标按键次数信息等，键盘操作信息包含键盘按键值、键盘按键时间信息和键盘按键次数信息等，操作流程信息包含鼠标键盘操作顺序信息和页面元素操作顺序信息等，上述鼠标键盘操作顺序是指鼠标操作行为和键盘操作行为中，各操作行为的先后顺序，页面元素是指各功能在网页上的元素，例如按钮、图片、链接等，每个网页中均包含多个页面元素，上述页面元素操作顺序是指用户针对各页面元素的操作顺序。

本申请实施例一中，可以但不限于通过行为采集代码来采集用户针对页面的操作行为，具体为：

网页浏览器在用户请求访问网页时，从网页服务器中获取行为采集代码，并在用户访问所述网页时，根据获取到的行为采集代码，采集所述用户针对所述网页的操作行为信息。

其中，网页浏览器可以但不限于通过下述两种方式从网页服务器中获取行为采集代码：

第一种方式，预先在网页的网页代码中***行为采集代码，后续用户访问该网页时，网页浏览器直接根据网页的网页代码中的行为采集代码来采集用户针对网页的操作行为信息，具体为：用户在网页浏览器中输入想要访问的网页的网址信息，然后确认访问，相当于向网页浏览器发送访问请求，该访问请求中携带有用户输入的网址信息，网页浏览器根据用户输入的网址信息，向对应的网页服务器发送该访问请求，网页服务器根据访问请求中携带的网址信息，查找与该网址信息对应的网页的网页代码，其中查找到的网页代码中包含行为采集代码，网页浏览器将查找到的网页代码发送给网页浏览器，网页浏览器根据接收到的网页代码，将该网页的页面内容提供给该用户，并将接收到的网页代码中的行为采集代码加载到用户访问该网页时的访问进程中，网页浏览器在用户访问该网页时，根据加载的行为采集代码，采集用户针对该网页的操作行为信息；

第二种方式，预先在网页的网页代码中***用于指示从网页服务器中获取行为采集代码的采集代码获取指示代码，后续用户请求访问该网页时，网页浏览器先根据网页的网页代码中的采集代码获取指示代码，从网页服务器中获取行为采集代码，然后在用户访问该网页时，根据获取的行为代码采集用户针对所述网页的操作行为信息，具体为：用户在网页浏览器中输入想要访问的网页的网址信息，然后确认访问，相当于向网页浏览器发送访问请求，该访问请求中携带有用户输入的网址信息，网页浏览器根据用户输入的网址信息，向对应的网页服务器发送该访问请求，网页服务器根据访问请求中携带的网址信息，查找与该网址信息对应的网页的网页代码，其中查找到的网页代码中包含采集代码获取指示代码，网页服务器将查找到的网页代码发送给网页浏览器，网页浏览器根据接收到的网页代码，将该网页的页面内容提供给该用户，并根据页面代码中的采集代码获取指示代码，向网页服务器发送采集代码获取请求，网页服务器接收到采集代码获取请求后，将行为采集代码发送给网页浏览器，网页浏览器将接收到的行为采集代码加载到用户访问该网页时的访问进程中，网页浏览器在用户访问该网页时，根据加载的行为采集代码，采集用户针对该网页的操作行为信息。

在上述第二种方式中，在网页代码中预先***行为代码获取指示代码，也可以称为“埋点”操作，网页浏览器接收到网页服务器发送的网页代码后，若执行到网页代码中所“埋”的“点”，则从网页服务器中获取行为采集代码，然后将获取到的行为采集代码放入网页代码中。

较佳地，上述第一种方式中，行为采集代码位于网页浏览器接收到的网页代码中，上述第二种方法中，网页浏览器获取到的行为采集代码也被***到网页代码中，若用户窃取到网页的网页代码后，分析网页代码中的行为采集代码，则可能会扰乱行为采集代码对操作行为信息的采集，使得采集到的操作行为信息是不准确的，那么确定机器行为的准确性也就较低，针对这一问题，本申请实施例一提出，在上述第二种方式中，网页服务器在接收到网页浏览器发送的采集代码获取请求后，可以先将待发送给网页浏览器的行为采集代码进行混淆，即使用混淆算法对行为采集代码进行混淆运算，将混淆之后的行为采集代码发送给网页浏览器，网页浏览器将混淆之后的行为采集代码***到网页代码中，然后根据与上述混淆算法对应的解混淆算法，对混淆之后的行为采集代码进行解混淆运算，将解混淆之后的行为采集代码加载到用户访问该网页时的访问进程中，此时，网页代码中的行为采集代码是经过混淆之后的行为采集代码，用户不能直接对该行为采集代码进行分析，因此能够有效地提高采集操作行为信息的准确性，进而提高了确定机器行为的准确性。

更佳地，为了进一步提高采集操作行为信息的准确性以及确定机器行为的准确性，本申请实施例一还提出对行为采集代码进行实时混淆的方法，预先在网页服务器中设置各个时间段与混淆算法之间的对应关系，在网页浏览器中设置各个时间段与解混淆算法之间的对应关系，网页服务器不再只使用一种混淆算法对行为采集代码进行混淆运算，而是根据接收到采集代码获取请求的时间点所在的时间段，在各个时间段与混淆算法之间的对应关系中查找该时间段对应的混淆算法，然后使用查找到的混淆算法对行为采集代码进行混淆，然后将混淆之后的行为采集代码发送给网页浏览器，网页浏览器接收到混淆之后的行为采集代码之后，将混淆之后的行为采集代码***到网页代码中，然后根据发送采集代码获取请求的时间点对应的时间段，在各个时间段与解混淆算法之间的对应关系中查找该时间段对应的解混淆算法，然后使用查找到的解混淆算法对混淆之后的行为采集代码进行解混淆运算，将解混淆之后的行为采集代码加载到用户访问该网页时的访问进程中，由于网页服务器在对行为采集代码进行混淆运算时，根据时间段不同采用不同的混淆算法，因此网页浏览器在不同时间段接收到的行为采集代码是不同的，即混淆算法是动态变化的，从而能够避免用户根据混淆之后的行为采集代码分析出混淆之前的行为采集代码，有效地提高采集操作行为信息的准确性和确定机器行为的准确性。

其中，上述行为采集代码可以但不限于为JAVA脚本(JS，JAVASCRIPT)代码，此时行为采集代码也可以称为JS采集代码，在网页代码中预先***行为代码获取指示代码的“埋点”操作也可以称为“JS埋点”操作。JS采集代码在采集用户针对网页的操作行为信息时，采用文档对象模型(DOM，Document Object Model)事件堆栈的方式记录用户的鼠标键盘事件。

此外，网页浏览器还可以通过行为采集代码记录用户的某些用户标识信息，例如用户的媒体接入控制(MAC，Medium Access Control)地址信息等。

本申请实施例一提出，可以预先在每个网页的网页代码中均***行为采集代码或者***采集代码获取指示代码，那么在用户访问每个网页时，网页服务器均能够判断该用户针对网页的操作行为是否为机器行为。此外，为了有针对性的确定机器行为，本申请实施例还提出，还可以只在指定的网页的网页代码中***行为采集代码或者***采集代码获取指示代码，例如在用户可能进行恶意注册的用户注册网页，或者在用户可能进行恶意登陆的登陆网页，或者在用户可能进行恶意发帖的发帖网页等。

步骤32，网页浏览器将获得的操作行为信息发送给网页服务器；

其中，网页浏览器在将操作行为信息发送给网页服务器之前，还可以根据预设的加密算法对操作行为信息进行加密运算，将加密后的操作行为信息发送给网页服务器之后，网页服务器根据预设的解密算法对操作行为信息进行解密，从而提高了操作行为信息在网页浏览器和网页服务器之间传输的安全性。

本申请实施例一中，网页浏览器将获得的操作行为信息发送给网页服务器的方式可以但不限于包含下述两种，具体为：

第一种方式，网页浏览器定时发送操作行为信息，即预先设置多个规定时间点，在到达每个规定时间点时，网页浏览器将上一规定时间点到当前规定时间点之间的时间段内，获得的、用户针对网页的操作行为信息发送给网页服务器；

第二种方式，网页浏览器只有在接收到用户发送的指定操作请求后，才将用户针对网页的操作行为信息发送给网页服务器，例如，若用户访问的网页为用户注册网页，则网页浏览器在接收到用户发送的注册请求(用户输入注册信息后确认注册)后，才将用户针对网页的操作行为信息发送给网页服务器；若用户访问的网页为用户登陆网页，则网页浏览器在接收到用户发送的登陆请求(用户输入登陆信息后确认登陆)后，才将用户针对网页的操作行为信息发送给网页服务器；若用户访问的网页为用户发帖网页，则网页浏览器在接收到用户发送的发帖请求(用户输入发帖信息后确认发帖)后，才将用户针对网页的操作行为信息发送给网页服务器。

步骤33，网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值；

其中确定用户针对网页的机器行为权重值可以但不限于通过下述方式实现：

网页服务器根据接收到的操作行为信息中的鼠标操作信息，确定对应的鼠标机器行为权重值W₁，根据接收到的操作行为信息中的键盘操作信息，确定对应的键盘机器行为权重值W₂，根据接收到的操作行为信息中的鼠标操作信息和键盘操作信息，确定对应的操作流程机器行为权重值W₃，然后根据鼠标机器行为权重值W₁、键盘机器行为权重值W₂和操作流程机器行为权重值W₃，确定用户针对网页的机器行为权重值。

其中，可以直接将鼠标机器行为权重值W₁、键盘机器行为权重值W₂和操作流程机器行为权重值W₃相加，得到用户针对网页的机器行为权重值，即W＝W₁+W₂+W₃。

还可以预先针对鼠标机器行为权重值、键盘机器行为权重值和操作流程机器行为权重值分别设置对应的权重因子，例如，针对鼠标机器行为权重值设置的鼠标机器行为权重因子为Q₁，针对键盘机器行为权重值设置的键盘机器行为权重因子为Q₂，针对操作流程机器行为权重值设置的操作流程机器行为权重因子为Q₃，然后针对每种机器行为权重值，分别将该机器行为权重值乘以对应的权重因子，然后再相加，即得到用户针对网页的机器行为权重值，即W＝W₁×Q₁+W₂×Q₂+W₃×Q₃。

在确定用户针对网页的机器行为时，可以预先建立机器行为识别分析模型，如图4所示，网页服务器通过该机器行为识别分析模型对鼠标行为进行分析(分析鼠标按键坐标、鼠标按键时间以及鼠标按键次数)，对键盘行为进行分析(分析键盘按键值、键盘按键时间以及键盘按键次数)，对操作流程进行分析(分析鼠标键盘操作顺序和页面元素操作顺序)，然后根据分析结果，确定鼠标机器行为权重值、键盘机器行为权重值以及操作流程机器行为权重值，进而确定用户针对网页的机器行为权重值。

其中可以但不限于采用下述两种方式建立机器行为识别分析模型，具体为：

第一种方式，针对每个用户标识信息对应的用户，分别对该用户针对需要确定机器行为的每个网页的多次操作行为信息进行学习、训练，然后建立该用户针对该网页的机器行为识别分析模型，将后续接收到的、该用户针对该网页的操作行为信息输入到机器行为识别分析模型中进行分析，根据分析结果确定该用户针对该网页的操作行为的机器行为权重值，其中，用户标识信息可以为IP地址信息，也可以为MAC地址信息，网页浏览器在采集用户针对网页的操作行为信息时，记录用户标识信息，然后和操作行为信息一起发送给网页服务器，网页服务器根据用户标识信息确定接收到的操作行为信息所属的用户，进而查找该用户对应的机器行为识别分析模型；

第二种方式，预先针对需要确定机器行为的每个网页，分别建立该网页的机器行为识别分析模型，后续接收到用户针对该网页的操作行为信息后，将接收到的操作行为信息输入到该网页的机器行为识别分析模型中进行分析，根据分析结果确定该用户针对该网页的操作行为的机器行为权重值。

步骤34，网页服务器在判断出所述机器行为权重值不小于规定阈值时，确定所述用户针对所述网页的操作行为为机器行为。

预先设置确定机器行为的规定阈值，若机器行为权重值小于该规定阈值，则可以认为该用户针对网页的操作行为不是机器行为，若机器行为权重值不小于该规定阈值，则可以认为该用户针对网页的操作行为是机器行为。

在确定出用户针对网页的操作行为为机器行为后，可以不对该用户的操作请求进行相应处理，从而节省了网页服务器较多的处理资源，提高了网页服务器的处理效率，节省了网页服务器较多的存储资源。此外，网页服务器确定出用户针对网页的操作行为为机器行为后，还可以但不限于将确定结果发送给网页浏览器，网页浏览器接收到该确定结果后，还可以将该确定结果提供给用户。

为了提高网页服务器确定机器行为的效率，节省网页服务器的处理资源，本申请实施例一提出，在确定出用户针对网页的操作行为为机器行为后，网页服务器可以将该用户的用户标识信息加入到恶意用户名单中，后续当网页服务器接收到网页浏览器发送的指定操作请求后，首先判断接收到的操作请求中包含的用户标识信息是否在恶意用户名单中，若判断结果为是，则不对用户的操作请求进行处理，从而节省了确定该用户针对网页的操作信息是否为机器行为的处理步骤。

此外，本申请实施例一还提出，网页服务器接收到网页浏览器发送的访问请求后，可以先判断访问请求中包含的用户标识信息是否在上述恶意用户名单中，若判断结果为是，则禁止用户访问该网页，从而避免用户后续向网页服务器发送操作请求，也就是说减少了用户通过网页浏览器向网页服务器发送的操作请求的数量，减轻了网页服务器的压力，提高了网页服务器的处理速度和处理效率。

其中，上述用户标识信息可以为用户的IP地址信息，也可以为用户的MAC地址信息。

由上述处理过程可知，本申请实施例技术方案中，网页浏览器在用户访问网页时，获得所述用户针对所述网页的操作行为信息，以及将获得的操作行为信息发送给网页服务器，网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值，并在判断出所述机器行为权重值不小于规定阈值时，确定所述用户针对所述网页的操作行为为机器行为，由上可见，本申请实施例技术方案不再通过IP地址分析方法或操作信息分析方法来确定机器行为，而是通过用户针对网页的操作行为来判断用户针对网页的操作行为是否为机器行为，这就有效地提高了确定机器行为的准确性，使得网页服务器能够准确地鉴别出机器行为，进而不对机器行为产生的各种操作请求(注册请求、登录请求、发帖请求、回复请求等)进行相应地处理，节省了网页服务器较多的处理资源，提高了网页服务器的处理效率，节省了网页服务器较多的存储资源。

实施例二

如图5所示，为本申请实施例二中机器行为确定方法具体实现流程图，其具体处理流程如下：

步骤51，用户请求访问网页时，网页浏览器向网页服务器发送访问请求，访问请求中包含用户请求访问的网页的网址信息；

步骤52，网页服务器根据访问请求中的网址信息，查找该网页对应的网页代码，查找到的网页代码中包含采集代码获取指示代码；

步骤53，网页服务器将查找到的网页代码发送给网页浏览器；

步骤54，网页浏览器根据接收到的网页代码为用户提供该网页的页面内容；

步骤55，网页浏览器根据采集代码获取指示代码，向网页服务器发送采集代码获取请求；

步骤56，网页服务器接收到采集代码获取请求后，对JS采集代码进行实时混淆；

步骤57，网页服务器将混淆后的JS采集代码发送给网页浏览器；

步骤58，网页浏览器对接收到的JS采集代码进行解混淆之后，将解混淆之后的JS采集代码加载到用户访问该网页时的访问进程中；

步骤59，网页浏览器在用户访问该网页时，根据加载的JS采集代码，采集用户针对该网页的操作行为信息，其中，用户针对网页的操作行为信息包括鼠标操作行为信息、键盘操作行为信息和操作流程信息；

步骤510，网页浏览器在接收到用户发送的指定操作请求后，将采集到的操作行为信息发送给网页服务器；

步骤511，网页服务器通过机器行为识别分析模型对操作行为信息进行分析；

步骤512，网页服务器根据分析结果确定用户针对网页的机器行为权重值；

步骤513，网页服务器根据机器行为权重值，确定用户针对网页的操作行为是否为机器行为，具体为：当机器行为权重值不小于规定阈值时，则确定用户针对网页的操作行为为机器行为；

步骤514，若确定出用户针对网页的操作行为为机器行为，则可以进行后续处理，具体为：不对该用户的操作请求进行相应处理，且将该用户的IP地址信息加入到恶意用户名单中，后续接收到网页浏览器发送的访问请求后，先判断访问请求中包含的IP地址信息是否在上述恶意用户名单中，若判断结果为是，则禁止用户访问该网页。

实施例三

与本申请实施例一提出的机器行为确定方法相对应，本申请实施例三提出一种网页浏览器，其结构如图6所示，包括获得单元61、发送单元62和接收单元63，其中：

获得单元61，用于在用户访问网页时，获得所述用户针对所述网页的操作行为信息；

发送单元62，用于将获得单元61获得的操作行为信息发送给网页服务器；

接收单元63，用于接收网页服务器发送的、确定所述用户针对所述网页的操作行为为机器行为的确定结果，其中，所述确定结果为网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值，并在判断出所述机器行为权重值不小于规定阈值时确定出的。

较佳地，所述获得单元61具体包括获取子单元和采集子单元，其中：

获取子单元，用于在用户请求访问网页时，从网页服务器中获取行为采集代码；

采集子单元，用于在用户访问所述网页时，根据获取子单元获取到的行为采集代码，采集所述用户针对所述网页的操作行为信息。

更佳地，所述获取子单元具体包括第一发送模块、第一接收模块、第一提供模块和第一采集模块，其中：

第一发送模块，用于在用户请求访问网页时，将携带有该网页的网址信息的访问请求发送给网页服务器；

第一接收模块，用于接收网页服务器发送的网页代码，所述网页代码中包含行为采集代码，所述网页代码是网页服务器根据所述网址信息查找到的；

第一提供模块，用于根据第一接收模块接收到的网页代码，将所述网页的页面内容提供给所述用户；

第一采集模块，用于根据所述网页代码中包含的行为采集代码，采集所述用户针对所述网页的操作行为信息。

更佳地，所述获取子单元具体包括第二发送模块、第二接收模块、第二提供模块、获取模块、第三接收模块和第二采集模块，其中：

第二发送模块，用于在用户请求访问网页时，将携带有该网页的网址信息的访问请求发送给网页服务器；

第二接收模块，用于接收网页服务器发送的网页代码，所述网页代码中包含采集代码获取指示代码，所述网页代码是网页服务器根据所述网址信息查找到的；

第二提供模块，用于根据第二接收模块接收到的网页代码，将所述网页的页面内容提供给所述用户；

获取模块，用于根据所述采集代码获取指示代码，向所述网页服务器发送采集代码获取请求；

第三接收模块，用于接收网页服务器发送的行为采集代码；

第二采集模块，用于根据接收到的行为采集代码，采集所述用户针对所述网页的操作行为信息。

更佳地，第二采集模块具体包括解混淆子模块和采集子模块，其中：

解混淆子模块，用于按照预设的解混淆算法，对第三接收模块接收到的行为采集代码进行解混淆运算；

采集子模块，用于根据解混淆子模块解混淆得到的行为采集代码，采集所述用户针对所述网页的操作行为信息。

更佳地，解混淆子模块具体用于：根据发送采集代码获取请求的时间点对应的时间段，在各个时间段与解混淆算法之间的对应关系中，查找该时间段对应的解混淆算法，并按照查找到的解混淆算法，对接收到的行为采集代码进行解混淆运算。

较佳地，所述获得单元61在到达规定时间点时，将上一规定时间点到当前规定时间点之间的时间段内，用户针对所述网页的操作行为信息发送给网页服务器。

较佳地，所述获得单元61具体包括接收子单元和发送子单元，其中：

接收子单元，用于接收用户发送的指定操作请求；

发送子单元，用于在接收子单元接收到指定操作请求后，将用户针对所述网页的操作行为信息发送给网页服务器。

实施例四

与本申请实施例一提出的机器行为确定方法相对应，本申请实施例四提出一种网页服务器，其结构如图7所示，包括第一接收单元71、第一确定单元72、第一判断单元73和第二确定单元74，其中：

第一接收单元71，用于接收网页浏览器发送的、用户针对网页的操作行为信息；

第一确定单元72，用于根据第一接收单元71接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值；

第一判断单元73，用于判断第一确定单元72确定出的所述机器行为权重值是否小于规定阈值；

第二确定单元74，用于在第一判断单元73的判断结果为否时，确定所述用户针对所述网页的操作行为为机器行为。

较佳地，所述网页服务器还包括第二接收单元、第一查找单元和第一发送单元，其中：

第二接收单元，用于在第一接收单元71接收到网页浏览器发送的操作行为信息之前，接收网页浏览器发送的访问请求，所述访问请求中携带有网址信息；

第一查找单元，用于根据第二接收单元接收到的访问请求中携带的所述网址信息，查找所述网址信息对应的网页的网页代码，所述网页代码中包含行为采集代码；

第一发送单元，用于将第一查找单元查找到的网页代码发送给网页浏览器。

较佳地，所述网页服务器还包括第三接收单元、第二查找单元、第二发送单元、第四接收单元和第三发送单元，其中：

第三接收单元，用于在第一接收单元71接收到网页浏览器发送的操作行为信息之前，接收网页浏览器发送的访问请求，所述访问请求中携带有网址信息；

第二查找单元，用于根据第三接收单元接收到的访问请求中携带的所述网址信息，查找所述网址信息对应的网页的网页代码，所述网页代码中包含采集代码获取指示代码；

第二发送单元，用于将第二查找单元查找到的网页代码发送给网页浏览器；

第四接收单元，用于接收网页浏览器发送的采集代码获取请求；

第三发送单元，用于在第四接收单元接收到所述采集代码获取请求后，将行为采集代码发送给所述网页浏览器。

更佳地，第三发送单元具体包括混淆子单元和发送子单元，其中：

混淆子单元，用于按照预设的混淆算法，将行为采集代码进行混淆运算；

发送子单元，用于将混淆子单元混淆得到的行为采集代码发送给所述网页浏览器。

更佳地，所述混淆子单元具体包括查找模块和混淆模块，其中：

查找模块，用于根据第四接收单元接收到采集代码获取请求的时间点所在的时间段，在各个时间段与混淆算法之间的对应关系中，查找该时间段对应的混淆算法；

混淆模块，用于按照查找模块查找到的混淆算法，对行为采集代码进行混淆。

较佳地，第一接收单元71接收到的操作行为信息包含鼠标操作信息、键盘操作信息和操作流程信息。

更佳地，所述第一确定单元72具体包括第一确定子单元、第二确定子单元、第三确定子单元和第四确定子单元，其中：

第一确定子单元，用于根据第一接收单元71接收到的操作行为信息中的鼠标操作信息，确定对应的鼠标机器行为权重值；

第二确定子单元，用于根据第一接收单元71接收到的操作行为信息中的键盘操作信息，确定对应的键盘机器行为权重值；

第三确定子单元，用于根据第一接收单元71接收到的操作流程信息，确定对应的操作流程机器行为权重值；

第四确定子单元，用于根据所述鼠标机器行为权重值、键盘机器行为权重值和操作流程机器行为权重值，确定所述用户针对所述网页的机器行为权重值。

较佳地，所述网页服务器还包括加入单元，用于在第二确定单元74确定所述用户针对所述网页的操作行为为机器行为时，将所述用户的用户标识信息加入到恶意用户名单。

更佳地，所述网页服务器还包括第五接收单元、第二判断单元和第一处理单元，其中：

第五接收单元，用于接收网页浏览器发送的指定操作请求，所述操作请求中包含用户标识信息；

第二判断单元，用于在第五接收单元接收到所述操作请求后，判断操作请求中包含的用户标识信息是否在所述恶意用户名单中；

第一处理单元，用于在第二判断单元的判断结果为是时，不对所述操作请求进行处理。

更佳地，所述网页服务器还包括第六接收单元、第三判断单元和第二处理单元，其中：

第六接收单元，用于接收网页浏览器在用户请求访问网页时发送的访问请求，所述访问请求中包含用户标识信息；

第三判断单元，用于在第六接收单元接收到所述访问请求后，判断访问请求中包含的用户标识信息是否在所述恶意用户名单中；

第二处理单元，用于在第二判断单元的判断结果为是时，禁止用户访问该网页。

本领域的技术人员应明白，本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种机器行为确定方法，其特征在于，包括：

网页浏览器在用户访问网页时，获得所述用户针对所述网页的操作行为信息；其中，用户针对所述网页的操作行为信息包含鼠标操作信息、键盘操作信息和操作流程信息；以及

将获得的操作行为信息发送给网页服务器；

网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值；并

在判断出所述机器行为权重值不小于规定阈值时，确定所述用户针对所述网页的操作行为为机器行为。

2.如权利要求1所述的机器行为确定方法，其特征在于，网页浏览器获得所述用户针对所述网页的操作行为信息，具体包括：

网页浏览器在用户请求访问网页时，从网页服务器中获取行为采集代码；并

在用户访问所述网页时，根据获取到的行为采集代码，采集所述用户针对所述网页的操作行为信息。

3.如权利要求2所述的机器行为确定方法，其特征在于，网页浏览器从网页服务器中获取行为采集代码，具体包括：

网页浏览器在用户请求访问网页时，将携带有该网页的网址信息的访问请求发送给网页服务器；

网页服务器根据所述网址信息，查找所述网址信息对应的网页的网页代码，所述网页代码中包含行为采集代码；并

将查找到的网页代码发送给网页浏览器；

网页浏览器根据接收到的网页代码，将所述网页的页面内容提供给所述用户；并

根据所述网页代码中包含的行为采集代码，采集所述用户针对所述网页的操作行为信息。

4.如权利要求2所述的机器行为确定方法，其特征在于，网页浏览器从网页服务器中获取行为采集代码，具体包括：

网页服务器根据所述网址信息，查找所述网址信息对应的网页的网页代码，所述网页代码中包含采集代码获取指示代码；以及

将查找到的网页代码发送给网页浏览器；

根据所述采集代码获取指示代码，向所述网页服务器发送采集代码获取请求；

所述网页服务器接收到所述采集代码获取请求后，将行为采集代码发送给所述网页浏览器；

网页浏览器根据接收到的行为采集代码，采集所述用户针对所述网页的操作行为信息。

5.如权利要求4所述的机器行为确定方法，其特征在于，所述网页服务器将行为采集代码发送给所述网页浏览器，具体包括：

所述网页服务器按照预设的混淆算法，将行为采集代码进行混淆运算；并

将混淆得到的行为采集代码发送给所述网页浏览器；

网页浏览器根据接收到的行为采集代码，采集所述用户针对所述网页的操作行为信息，具体包括：

网页浏览器接收到网页服务器发送的行为采集代码之后，按照预设的解混淆算法，对接收到的行为采集代码进行解混淆运算；并

根据解混淆得到的行为采集代码，采集所述用户针对所述网页的操作行为信息。

6.如权利要求5所述的机器行为确定方法，其特征在于，所述网页服务器按照预设的混淆算法，将行为采集代码进行混淆运算，具体包括：

网页服务器根据接收到采集代码获取请求的时间点所在的时间段，在各个时间段与混淆算法之间的对应关系中，查找该时间段对应的混淆算法；并

按照查找到的混淆算法，对行为采集代码进行混淆；

网页浏览器按照预设的解混淆算法，对接收到的行为采集代码进行解混淆运算，具体包括：

网页浏览器根据发送采集代码获取请求的时间点对应的时间段，在各个时间段与解混淆算法之间的对应关系中，查找该时间段对应的解混淆算法；并

按照查找到的解混淆算法，对接收到的行为采集代码进行解混淆运算。

7.如权利要求2～6任一权利要求所述的机器行为确定方法，其特征在于，所述行为采集代码为JAVASCRIPT代码。

8.如权利要求1所述的机器行为确定方法，其特征在于，网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值，具体包括：

网页服务器根据接收到的操作行为信息中的鼠标操作信息，确定对应的鼠标机器行为权重值；以及

根据接收到的操作行为信息中的键盘操作信息，确定对应的键盘机器行为权重值；

网页服务器根据接收到的操作流程信息，确定对应的操作流程机器行为权重值；并

根据鼠标机器行为权重值、键盘机器行为权重值和操作流程机器行为权重值，确定所述用户针对所述网页的机器行为权重值。

9.如权利要求8所述的机器行为确定方法，其特征在于，通过下述方式确定所述用户针对所述网页的机器行为权重值：

W＝W₁×Q₁+W₂×Q₂+W₃×Q₃

其中，W为所述用户针对所述网页的机器行为权重值；

W₁为鼠标机器行为权重值；

Q₁为鼠标机器行为权重因子；

W₂为键盘机器行为权重值；

Q₂为键盘机器行为权重因子；

W₃为操作流程机器行为权重值；

Q₃为操作流程机器行为权重因子。

10.如权利要求1所述的机器行为确定方法，其特征在于，网页浏览器将获得的操作行为信息发送给网页服务器，具体包括：

网页浏览器在到达规定时间点时，将上一规定时间点到当前规定时间点之间的时间段内，用户针对所述网页的操作行为信息发送给网页服务器。

11.如权利要求1所述的机器行为确定方法，其特征在于，网页浏览器将获得的操作行为信息发送给网页服务器，具体包括：

网页浏览器在接收到用户发送的指定操作请求后，将用户针对所述网页的操作行为信息发送给网页服务器。

12.如权利要求1所述的机器行为确定方法，其特征在于，还包括：

所述网页服务器将所述用户的用户标识信息加入到恶意用户名单。

13.如权利要求12所述的机器行为确定方法，其特征在于，还包括：

所述网页服务器接收网页浏览器发送的指定操作请求，所述操作请求中包含用户标识信息；

网页服务器接收到所述操作请求后，判断操作请求中包含的用户标识信息是否在所述恶意用户名单中；

若判断结果为是，则不对所述操作请求进行处理。

14.如权利要求12所述的机器行为确定方法，其特征在于，还包括：

所述网页服务器接收网页浏览器在用户请求访问网页时发送的访问请求，所述访问请求中包含用户标识信息；

网页服务器在接收到访问请求后，判断访问请求中包含的用户标识信息是否在所述恶意用户名单中；

若判断结果为是，则禁止用户访问该网页。

15.一种网页浏览器，其特征在于，包括：

获得单元，用于在用户访问网页时，获得所述用户针对所述网页的操作行为信息；其中，用户针对所述网页的操作行为信息包含鼠标操作信息、键盘操作信息和操作流程信息；

发送单元，用于将获得单元获得的操作行为信息发送给网页服务器；

接收单元，用于接收网页服务器发送的、确定所述用户针对所述网页的操作行为为机器行为的确定结果，其中，所述确定结果为网页服务器根据接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值，并在判断出所述机器行为权重值不小于规定阈值时确定出的。

16.如权利要求15所述的网页浏览器，其特征在于，所述获得单元具体包括：

17.如权利要求16所述的网页浏览器，其特征在于，所述获取子单元具体包括：

18.如权利要求16所述的网页浏览器，其特征在于，所述获取子单元具体包括：

第三接收模块，用于接收网页服务器发送的行为采集代码；

19.如权利要求18所述的网页浏览器，其特征在于，第二采集模块具体包括：

20.如权利要求19所述的网页浏览器，其特征在于，解混淆子模块具体用于：根据发送采集代码获取请求的时间点对应的时间段，在各个时间段与解混淆算法之间的对应关系中，查找该时间段对应的解混淆算法，并按照查找到的解混淆算法，对接收到的行为采集代码进行解混淆运算。

21.如权利要求15所述的网页浏览器，其特征在于，所述获得单元在到达规定时间点时，将上一规定时间点到当前规定时间点之间的时间段内，用户针对所述网页的操作行为信息发送给网页服务器。

22.如权利要求15所述的网页浏览器，其特征在于，所述获得单元具体包括：

接收子单元，用于接收用户发送的指定操作请求；

23.一种网页服务器，其特征在于，包括：

第一接收单元，用于接收网页浏览器发送的、用户针对网页的操作行为信息；其中，第一接收单元接收到的操作行为信息包含鼠标操作信息、键盘操作信息和操作流程信息；

第一确定单元，用于根据第一接收单元接收到的操作行为信息，确定所述用户针对所述网页的机器行为权重值；

第一判断单元，用于判断第一确定单元确定出的所述机器行为权重值是否小于规定阈值；

第二确定单元，用于在第一判断单元的判断结果为否时，确定所述用户针对所述网页的操作行为为机器行为。

24.如权利要求23所述的网页服务器，其特征在于，还包括：

第二接收单元，用于在第一接收单元接收到网页浏览器发送的操作行为信息之前，接收网页浏览器发送的访问请求，所述访问请求中携带有网址信息；

25.如权利要求23所述的网页服务器，其特征在于，还包括：

第三接收单元，用于在第一接收单元接收到网页浏览器发送的操作行为信息之前，接收网页浏览器发送的访问请求，所述访问请求中携带有网址信息；

26.如权利要求25所述的网页服务器，其特征在于，第三发送单元具体包括：

27.如权利要求26所述的网页服务器，其特征在于，所述混淆子单元具体包括：

28.如权利要求23所述的网页服务器，其特征在于，第一确定单元具体包括：

第一确定子单元，用于根据第一接收单元接收到的操作行为信息中的鼠标操作信息，确定对应的鼠标机器行为权重值；

第二确定子单元，用于根据第一接收单元接收到的操作行为信息中的键盘操作信息，确定对应的键盘机器行为权重值；

第三确定子单元，用于根据第一接收单元接收到的操作流程信息，确定对应的操作流程机器行为权重值；

29.如权利要求23所述的网页服务器，其特征在于，还包括：

加入单元，用于在第二确定单元确定所述用户针对所述网页的操作行为为机器行为时，将所述用户的用户标识信息加入到恶意用户名单。

30.如权利要求29所述的网页服务器，其特征在于，还包括：

31.如权利要求29所述的网页服务器，其特征在于，还包括：