CN112906752A

CN112906752A - 一种基于浏览历史序列的用户身份认证方法

Info

Publication number: CN112906752A
Application number: CN202110104841.7A
Authority: CN
Inventors: 潘晓光; 王小华; 令狐彬; 张雅娜; 宋晓晨
Original assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Current assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-06-04

Abstract

本发明属于网络安全技术领域，具体涉及一种基于浏览历史序列的用户身份认证方法，包括下列步骤：离线行为建模和存储阶段，收集用户浏览历史；通过用户浏览历史构建状态转移图，然后将状态转移图进入行为马尔科夫模型进行构建；构建用户的行为马尔科夫模型，最后将构建好的用户行为马尔科夫模型存储在数据库中；用户Web浏览行为在线分析和认证阶段，进行身份可信度验证。本发明基于客户端收集的网页浏览数据，利用隐马尔科夫模型的特性构建网络浏览的逻辑行为模型，从用户浏览序列的角度对用户身份进行认证。本发明用于用户身份的认证。

Description

一种基于浏览历史序列的用户身份认证方法

技术领域

本发明属于网络安全技术领域，具体涉及一种基于浏览历史序列的用户身份认证方法。

背景技术

如今电子商务中存在电子交易欺诈行为，开放的网络环境存在许多网络罪犯，骗子即使不暴露自己也能够欺骗别人，因此，保护电子交易的安全性是至关重要的。

现有的用户身份验证方式可以分为三种类别：1)基于用户的生物特征例如指纹、虹膜。2)用户的物理行为，例如鼠标、键盘；3)用户的浏览内容。对于第一种方法，个体的生物特征信息很容易被窃取和模仿，并且需要额外的硬件设备，但是大部分计算机不支持这些必要的硬件；对于第二种方法，不同类型的输入硬件，输入数据会有所不同，同时用户的输入硬件经常发生变化，这些不确定性因素导致了物理行为方法对用户身份认证的不准确性。对于第三种方法，其在服务端收集用户数据，但是这些方法侧重于web用户群，基于用户群的web挖掘只能发现用户的共同特征，不能有效地处理收集用户数据和恰当描述每个用户的逻辑浏览行为。

发明内容

针对上述现有的用户身份验证方式不能有效地处理收集用户数据和恰当描述每个用户的逻辑浏览行为的技术问题，本发明提供了一种准确率高、误差小、稳定性强的基于浏览历史序列的用户身份认证方法。

为了解决上述技术问题，本发明采用的技术方案为：

一种基于浏览历史序列的用户身份认证方法，包括下列步骤：

S1、离线行为建模和存储阶段，收集用户浏览历史；

S2、通过用户浏览历史构建状态转移图，然后将状态转移图进入行为马尔科夫模型进行构建；

S3、构建用户的行为马尔科夫模型，最后将构建好的用户行为马尔科夫模型存储在数据库中；

S4、用户Web浏览行为在线分析和认证阶段，通过获取用户登录时输入的身份信息，首先从数据库中取出用户的行为马尔科夫模型，用户在浏览页面时，获取其访问web页面的序列，进行身份可信度验证。

所述S1中收集用户浏览历史的方法为：在客户端离线收集用户的浏览历史数据，删除每个web用户的噪音记录，所述用户的浏览历史数据为：用户1、用户2、…、用户m的n天浏览历史。

所述S2中的状态转移图是一个有向图，所述状态转移图的节点表示用户在一定时间内浏览不同web页面的集合，所述状态转移图的边表示从用户浏览链接中挖掘的浏览web页面的顺序关系；所述状态转移图的的每条边上都有一个权重值，表示该边在浏览历史中的频率。

所述S3中构建用户的行为马尔科夫模型的方法为：状态转移图进入行为马尔科夫模型构建模块，用来构造用户的行为马尔科夫模型M＝(A,B,π),A表示用户访问的不同web页面种类，B表示不同类别web页面之间的转移概率，π表示初始概率分布，构建好的用户行为马尔科夫模型会存储在数据库中，用于在线认证时的分析。

所述S4中身份可信度验证的方法为：包括下列步骤：

S4.1、网络浏览可信度计算：当用户登录时，通过用户访问网站的序列持续计算用户的浏览行为可信度；

S4.2、平均可信度加固计算：当用户登录时，通过用户访问网站时间和web页面类别进行可信度计算，作为辅助方法认证用户身份。

所述S4.1中网络浏览可信度计算的方法为：当可信度低于预设阈值时，认证***确认当前登录用户身份虚假。

所述S4.2中平均可信度加固计算的方法为：当用户登录时，只通过用户访问网站时间和web页面类别进行可信度计算，作为辅助方法认证用户身份。

所述网络浏览可信度计算和平均可信度加固计算的计算结果与数据库中用户的行为马尔科夫模型进行对比，从而判断用户的身份认证信息。

本发明与现有技术相比，具有的有益效果是：

本发明基于客户端收集的网页浏览数据，利用隐马尔科夫模型的特性构建网络浏览的逻辑行为模型，从用户浏览序列的角度对用户身份进行认证。同时本发明不存在现有方法面临的问题，例如硬件设备的需求、用户群体的限制等，并且本发明大大的提高了身份认证的准确率。

附图说明

图1为本发明的主要步骤流程图；

图2为本申请公开的状态转移示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于浏览历史序列的用户身份认证方法，如图1所示，包括下列步骤：

S1、离线行为建模和存储阶段，收集用户浏览历史；

进一步，S1中收集用户浏览历史的方法为：在客户端离线收集用户的浏览历史数据，删除每个web用户的噪音记录，所述用户的浏览历史数据为：用户1、用户2、…、用户m的n天浏览历史。例如访问url错误和在浏览器中自动打开的web页面，以此来进一步提高建模的精度。

进一步，如图2所示，S2中的状态转移图是一个有向图，节点表示用户在一定时间内(例如几天)浏览不同web页面的集合，边表示从用户浏览链接中挖掘的浏览web页面的顺序关系。图的每条边上都有一个权重值，它表示该边在浏览历史中的频率，收集到的数据进入状态转移图构建模块，将每个用户的访问历史构建为状态转移图，节点表示不同的web页面，边表示访问顺序，边上的权重表示访问频率。

进一步，S3中构建用户的行为马尔科夫模型的方法为：状态转移图进入行为马尔科夫模型构建模块，用来构造用户的行为马尔科夫模型M＝(A,B,π),A表示用户访问的不同web页面种类，B表示不同类别web页面之间的转移概率，π表示初始概率分布，构建好的用户行为马尔科夫模型会存储在数据库中，用于在线认证时的分析。

进一步，S4中身份可信度验证的方法为：包括下列步骤：

进一步，S4.1中网络浏览可信度计算的方法为：当可信度低于预设阈值时，认证***确认当前登录用户身份虚假。

进一步，S4.2中平均可信度加固计算的方法为：当用户登录时，只通过用户访问网站时间和web页面类别进行可信度计算，作为辅助方法认证用户身份。

进一步，网络浏览可信度计算和平均可信度加固计算的计算结果与数据库中用户的行为马尔科夫模型进行对比，从而判断用户的身份认证信息。

上面仅对本发明的较佳实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化，各种变化均应包含在本发明的保护范围之内。

Claims

1.一种基于浏览历史序列的用户身份认证方法，其特征在于：包括下列步骤：

S1、离线行为建模和存储阶段，收集用户浏览历史；

2.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法，其特征在于：所述S1中收集用户浏览历史的方法为：在客户端离线收集用户的浏览历史数据，删除每个web用户的噪音记录，所述用户的浏览历史数据为：用户1、用户2、…、用户m的n天浏览历史。

3.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法，其特征在于：所述S2中的状态转移图是一个有向图，所述状态转移图的节点表示用户在一定时间内浏览不同web页面的集合，所述状态转移图的边表示从用户浏览链接中挖掘的浏览web页面的顺序关系；所述状态转移图的的每条边上都有一个权重值，表示该边在浏览历史中的频率。

4.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法，其特征在于：所述S3中构建用户的行为马尔科夫模型的方法为：状态转移图进入行为马尔科夫模型构建模块，用来构造用户的行为马尔科夫模型M＝(A,B,π),A表示用户访问的不同web页面种类，B表示不同类别web页面之间的转移概率，π表示初始概率分布，构建好的用户行为马尔科夫模型会存储在数据库中，用于在线认证时的分析。

5.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法，其特征在于：所述S4中身份可信度验证的方法为：包括下列步骤：

6.根据权利要求5所述的一种基于浏览历史序列的用户身份认证方法，其特征在于：所述S4.1中网络浏览可信度计算的方法为：当可信度低于预设阈值时，认证***确认当前登录用户身份虚假。

7.根据权利要求5所述的一种基于浏览历史序列的用户身份认证方法，其特征在于：所述S4.2中平均可信度加固计算的方法为：当用户登录时，只通过用户访问网站时间和web页面类别进行可信度计算，作为辅助方法认证用户身份。

8.根据权利要求5所述的一种基于浏览历史序列的用户身份认证方法，其特征在于：所述网络浏览可信度计算和平均可信度加固计算的计算结果与数据库中用户的行为马尔科夫模型进行对比，从而判断用户的身份认证信息。