CN112906752A - 一种基于浏览历史序列的用户身份认证方法 - Google Patents

一种基于浏览历史序列的用户身份认证方法 Download PDF

Info

Publication number
CN112906752A
CN112906752A CN202110104841.7A CN202110104841A CN112906752A CN 112906752 A CN112906752 A CN 112906752A CN 202110104841 A CN202110104841 A CN 202110104841A CN 112906752 A CN112906752 A CN 112906752A
Authority
CN
China
Prior art keywords
user
behavior
browsing history
browsing
markov model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110104841.7A
Other languages
English (en)
Inventor
潘晓光
王小华
令狐彬
张雅娜
宋晓晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Sanyouhe Smart Information Technology Co Ltd
Original Assignee
Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi Sanyouhe Smart Information Technology Co Ltd filed Critical Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority to CN202110104841.7A priority Critical patent/CN112906752A/zh
Publication of CN112906752A publication Critical patent/CN112906752A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于网络安全技术领域,具体涉及一种基于浏览历史序列的用户身份认证方法,包括下列步骤:离线行为建模和存储阶段,收集用户浏览历史;通过用户浏览历史构建状态转移图,然后将状态转移图进入行为马尔科夫模型进行构建;构建用户的行为马尔科夫模型,最后将构建好的用户行为马尔科夫模型存储在数据库中;用户Web浏览行为在线分析和认证阶段,进行身份可信度验证。本发明基于客户端收集的网页浏览数据,利用隐马尔科夫模型的特性构建网络浏览的逻辑行为模型,从用户浏览序列的角度对用户身份进行认证。本发明用于用户身份的认证。

Description

一种基于浏览历史序列的用户身份认证方法
技术领域
本发明属于网络安全技术领域,具体涉及一种基于浏览历史序列的用户身份认证方法。
背景技术
如今电子商务中存在电子交易欺诈行为,开放的网络环境存在许多网络罪犯,骗子即使不暴露自己也能够欺骗别人,因此,保护电子交易的安全性是至关重要的。
现有的用户身份验证方式可以分为三种类别:1)基于用户的生物特征例如指纹、虹膜。2)用户的物理行为,例如鼠标、键盘;3)用户的浏览内容。对于第一种方法,个体的生物特征信息很容易被窃取和模仿,并且需要额外的硬件设备,但是大部分计算机不支持这些必要的硬件;对于第二种方法,不同类型的输入硬件,输入数据会有所不同,同时用户的输入硬件经常发生变化,这些不确定性因素导致了物理行为方法对用户身份认证的不准确性。对于第三种方法,其在服务端收集用户数据,但是这些方法侧重于web用户群,基于用户群的web挖掘只能发现用户的共同特征,不能有效地处理收集用户数据和恰当描述每个用户的逻辑浏览行为。
发明内容
针对上述现有的用户身份验证方式不能有效地处理收集用户数据和恰当描述每个用户的逻辑浏览行为的技术问题,本发明提供了一种准确率高、误差小、稳定性强的基于浏览历史序列的用户身份认证方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于浏览历史序列的用户身份认证方法,包括下列步骤:
S1、离线行为建模和存储阶段,收集用户浏览历史;
S2、通过用户浏览历史构建状态转移图,然后将状态转移图进入行为马尔科夫模型进行构建;
S3、构建用户的行为马尔科夫模型,最后将构建好的用户行为马尔科夫模型存储在数据库中;
S4、用户Web浏览行为在线分析和认证阶段,通过获取用户登录时输入的身份信息,首先从数据库中取出用户的行为马尔科夫模型,用户在浏览页面时,获取其访问web页面的序列,进行身份可信度验证。
所述S1中收集用户浏览历史的方法为:在客户端离线收集用户的浏览历史数据,删除每个web用户的噪音记录,所述用户的浏览历史数据为:用户1、用户2、…、用户m的n天浏览历史。
所述S2中的状态转移图是一个有向图,所述状态转移图的节点表示用户在一定时间内浏览不同web页面的集合,所述状态转移图的边表示从用户浏览链接中挖掘的浏览web页面的顺序关系;所述状态转移图的的每条边上都有一个权重值,表示该边在浏览历史中的频率。
所述S3中构建用户的行为马尔科夫模型的方法为:状态转移图进入行为马尔科夫模型构建模块,用来构造用户的行为马尔科夫模型M=(A,B,π),A表示用户访问的不同web页面种类,B表示不同类别web页面之间的转移概率,π表示初始概率分布,构建好的用户行为马尔科夫模型会存储在数据库中,用于在线认证时的分析。
所述S4中身份可信度验证的方法为:包括下列步骤:
S4.1、网络浏览可信度计算:当用户登录时,通过用户访问网站的序列持续计算用户的浏览行为可信度;
S4.2、平均可信度加固计算:当用户登录时,通过用户访问网站时间和web页面类别进行可信度计算,作为辅助方法认证用户身份。
所述S4.1中网络浏览可信度计算的方法为:当可信度低于预设阈值时,认证***确认当前登录用户身份虚假。
所述S4.2中平均可信度加固计算的方法为:当用户登录时,只通过用户访问网站时间和web页面类别进行可信度计算,作为辅助方法认证用户身份。
所述网络浏览可信度计算和平均可信度加固计算的计算结果与数据库中用户的行为马尔科夫模型进行对比,从而判断用户的身份认证信息。
本发明与现有技术相比,具有的有益效果是:
本发明基于客户端收集的网页浏览数据,利用隐马尔科夫模型的特性构建网络浏览的逻辑行为模型,从用户浏览序列的角度对用户身份进行认证。同时本发明不存在现有方法面临的问题,例如硬件设备的需求、用户群体的限制等,并且本发明大大的提高了身份认证的准确率。
附图说明
图1为本发明的主要步骤流程图;
图2为本申请公开的状态转移示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于浏览历史序列的用户身份认证方法,如图1所示,包括下列步骤:
S1、离线行为建模和存储阶段,收集用户浏览历史;
S2、通过用户浏览历史构建状态转移图,然后将状态转移图进入行为马尔科夫模型进行构建;
S3、构建用户的行为马尔科夫模型,最后将构建好的用户行为马尔科夫模型存储在数据库中;
S4、用户Web浏览行为在线分析和认证阶段,通过获取用户登录时输入的身份信息,首先从数据库中取出用户的行为马尔科夫模型,用户在浏览页面时,获取其访问web页面的序列,进行身份可信度验证。
进一步,S1中收集用户浏览历史的方法为:在客户端离线收集用户的浏览历史数据,删除每个web用户的噪音记录,所述用户的浏览历史数据为:用户1、用户2、…、用户m的n天浏览历史。例如访问url错误和在浏览器中自动打开的web页面,以此来进一步提高建模的精度。
进一步,如图2所示,S2中的状态转移图是一个有向图,节点表示用户在一定时间内(例如几天)浏览不同web页面的集合,边表示从用户浏览链接中挖掘的浏览web页面的顺序关系。图的每条边上都有一个权重值,它表示该边在浏览历史中的频率,收集到的数据进入状态转移图构建模块,将每个用户的访问历史构建为状态转移图,节点表示不同的web页面,边表示访问顺序,边上的权重表示访问频率。
进一步,S3中构建用户的行为马尔科夫模型的方法为:状态转移图进入行为马尔科夫模型构建模块,用来构造用户的行为马尔科夫模型M=(A,B,π),A表示用户访问的不同web页面种类,B表示不同类别web页面之间的转移概率,π表示初始概率分布,构建好的用户行为马尔科夫模型会存储在数据库中,用于在线认证时的分析。
进一步,S4中身份可信度验证的方法为:包括下列步骤:
S4.1、网络浏览可信度计算:当用户登录时,通过用户访问网站的序列持续计算用户的浏览行为可信度;
S4.2、平均可信度加固计算:当用户登录时,通过用户访问网站时间和web页面类别进行可信度计算,作为辅助方法认证用户身份。
进一步,S4.1中网络浏览可信度计算的方法为:当可信度低于预设阈值时,认证***确认当前登录用户身份虚假。
进一步,S4.2中平均可信度加固计算的方法为:当用户登录时,只通过用户访问网站时间和web页面类别进行可信度计算,作为辅助方法认证用户身份。
进一步,网络浏览可信度计算和平均可信度加固计算的计算结果与数据库中用户的行为马尔科夫模型进行对比,从而判断用户的身份认证信息。
上面仅对本发明的较佳实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化,各种变化均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于浏览历史序列的用户身份认证方法,其特征在于:包括下列步骤:
S1、离线行为建模和存储阶段,收集用户浏览历史;
S2、通过用户浏览历史构建状态转移图,然后将状态转移图进入行为马尔科夫模型进行构建;
S3、构建用户的行为马尔科夫模型,最后将构建好的用户行为马尔科夫模型存储在数据库中;
S4、用户Web浏览行为在线分析和认证阶段,通过获取用户登录时输入的身份信息,首先从数据库中取出用户的行为马尔科夫模型,用户在浏览页面时,获取其访问web页面的序列,进行身份可信度验证。
2.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法,其特征在于:所述S1中收集用户浏览历史的方法为:在客户端离线收集用户的浏览历史数据,删除每个web用户的噪音记录,所述用户的浏览历史数据为:用户1、用户2、…、用户m的n天浏览历史。
3.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法,其特征在于:所述S2中的状态转移图是一个有向图,所述状态转移图的节点表示用户在一定时间内浏览不同web页面的集合,所述状态转移图的边表示从用户浏览链接中挖掘的浏览web页面的顺序关系;所述状态转移图的的每条边上都有一个权重值,表示该边在浏览历史中的频率。
4.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法,其特征在于:所述S3中构建用户的行为马尔科夫模型的方法为:状态转移图进入行为马尔科夫模型构建模块,用来构造用户的行为马尔科夫模型M=(A,B,π),A表示用户访问的不同web页面种类,B表示不同类别web页面之间的转移概率,π表示初始概率分布,构建好的用户行为马尔科夫模型会存储在数据库中,用于在线认证时的分析。
5.根据权利要求1所述的一种基于浏览历史序列的用户身份认证方法,其特征在于:所述S4中身份可信度验证的方法为:包括下列步骤:
S4.1、网络浏览可信度计算:当用户登录时,通过用户访问网站的序列持续计算用户的浏览行为可信度;
S4.2、平均可信度加固计算:当用户登录时,通过用户访问网站时间和web页面类别进行可信度计算,作为辅助方法认证用户身份。
6.根据权利要求5所述的一种基于浏览历史序列的用户身份认证方法,其特征在于:所述S4.1中网络浏览可信度计算的方法为:当可信度低于预设阈值时,认证***确认当前登录用户身份虚假。
7.根据权利要求5所述的一种基于浏览历史序列的用户身份认证方法,其特征在于:所述S4.2中平均可信度加固计算的方法为:当用户登录时,只通过用户访问网站时间和web页面类别进行可信度计算,作为辅助方法认证用户身份。
8.根据权利要求5所述的一种基于浏览历史序列的用户身份认证方法,其特征在于:所述网络浏览可信度计算和平均可信度加固计算的计算结果与数据库中用户的行为马尔科夫模型进行对比,从而判断用户的身份认证信息。
CN202110104841.7A 2021-01-26 2021-01-26 一种基于浏览历史序列的用户身份认证方法 Pending CN112906752A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110104841.7A CN112906752A (zh) 2021-01-26 2021-01-26 一种基于浏览历史序列的用户身份认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110104841.7A CN112906752A (zh) 2021-01-26 2021-01-26 一种基于浏览历史序列的用户身份认证方法

Publications (1)

Publication Number Publication Date
CN112906752A true CN112906752A (zh) 2021-06-04

Family

ID=76120243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110104841.7A Pending CN112906752A (zh) 2021-01-26 2021-01-26 一种基于浏览历史序列的用户身份认证方法

Country Status (1)

Country Link
CN (1) CN112906752A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101951321A (zh) * 2008-10-23 2011-01-19 普天信息技术研究院有限公司 一种实现身份认证的装置、***及方法
CN102970289A (zh) * 2012-11-09 2013-03-13 同济大学 基于Web用户行为模式的身份认证方法
CN103744957A (zh) * 2014-01-06 2014-04-23 同济大学 基于Web用户时间属性的序列模式挖掘方法
CN104618372A (zh) * 2015-02-02 2015-05-13 同济大学 一种基于web浏览习惯的用户身份认证装置和方法
CN105991281A (zh) * 2015-02-04 2016-10-05 ***通信集团公司 一种身份认证方法、设备及***
CN109450879A (zh) * 2018-10-25 2019-03-08 ***通信集团海南有限公司 用户访问行为监控方法、电子装置和计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101951321A (zh) * 2008-10-23 2011-01-19 普天信息技术研究院有限公司 一种实现身份认证的装置、***及方法
CN102970289A (zh) * 2012-11-09 2013-03-13 同济大学 基于Web用户行为模式的身份认证方法
CN103744957A (zh) * 2014-01-06 2014-04-23 同济大学 基于Web用户时间属性的序列模式挖掘方法
CN104618372A (zh) * 2015-02-02 2015-05-13 同济大学 一种基于web浏览习惯的用户身份认证装置和方法
CN105991281A (zh) * 2015-02-04 2016-10-05 ***通信集团公司 一种身份认证方法、设备及***
CN109450879A (zh) * 2018-10-25 2019-03-08 ***通信集团海南有限公司 用户访问行为监控方法、电子装置和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN112084383B (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
US11797657B1 (en) Behavioral profiling method and system to authenticate a user
US10091180B1 (en) Behavioral profiling method and system to authenticate a user
CN111784348B (zh) 账户风险识别方法及装置
CN103530546B (zh) 一种基于用户鼠标行为的身份认证方法
US7497374B2 (en) Fraud risk advisor
CN102970289B (zh) 基于Web用户行为模式的身份认证方法
CN105590055A (zh) 用于在网络交互***中识别用户可信行为的方法及装置
CN104426884A (zh) 身份鉴权的方法及装置
Wang et al. Representing fine-grained co-occurrences for behavior-based fraud detection in online payment services
Bergadano et al. Identity verification through dynamic keystroke analysis
CN109871673B (zh) 基于不同上下文环境中的持续身份认证方法和***
US9032491B2 (en) Multi-factor authentication enrollment optimization method and apparatus
KR100949439B1 (ko) 신뢰 모델에서 언페어 레이팅을 필터링하기 위한 행동 기반방법
CN109753783A (zh) 一种基于机器学习的单点登录方法、装置及计算机可读存储介质
CN110929525A (zh) 一种网贷风险行为分析检测方法、装置、设备和存储介质
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
CN1213398C (zh) 使用行为模型来进行无干扰的说话者验证的方法和***
Zhao et al. Authenticating web user’s identity through browsing sequences modeling
CN112906752A (zh) 一种基于浏览历史序列的用户身份认证方法
Gunetti et al. Dealing with different languages and old profiles in keystroke analysis of free text
US20210182710A1 (en) Method and system of user identification by a sequence of opened user interface windows
CN112084408A (zh) 名单数据筛选方法、装置、计算机设备及存储介质
CN117692261B (zh) 一种基于行为子图表征的恶意Bot识别方法
Bansal et al. Continuous Authentication in the Digital Age: An Analysis of Reinforcement Learning and Behavioral Biometrics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210604