CN111737668B - 一种基于用户输入行为特征的安全认证方法及*** - Google Patents

一种基于用户输入行为特征的安全认证方法及*** Download PDF

Info

Publication number
CN111737668B
CN111737668B CN202010829531.7A CN202010829531A CN111737668B CN 111737668 B CN111737668 B CN 111737668B CN 202010829531 A CN202010829531 A CN 202010829531A CN 111737668 B CN111737668 B CN 111737668B
Authority
CN
China
Prior art keywords
input
word
new
habitual
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010829531.7A
Other languages
English (en)
Other versions
CN111737668A (zh
Inventor
谭伟良
史伟
闵宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Eflycloud Computing Co Ltd
Original Assignee
Guangdong Eflycloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Eflycloud Computing Co Ltd filed Critical Guangdong Eflycloud Computing Co Ltd
Priority to CN202010829531.7A priority Critical patent/CN111737668B/zh
Publication of CN111737668A publication Critical patent/CN111737668A/zh
Application granted granted Critical
Publication of CN111737668B publication Critical patent/CN111737668B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/316User authentication by observing the pattern of computer usage, e.g. typical user behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Social Psychology (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

本发明公开一种基于用户输入行为特征的安全认证方法及***,安全认证方法步骤包括:采集输入词,对输入词划分成正常输入习惯词样本和错误输入习惯词样本;对正常输入习惯词样本,建立正确输入习惯行为特征趋势图;对错误输入习惯词样本,计算输入词的错误输入习惯词特征;在安全认证时期内,采集新输入词;对新输入词划分新正常输入习惯词样本和新错误输入习惯词样本;对新正常输入习惯词样本,将新输入词代入正确输入习惯行为特征趋势图中进行对比;在新错误输入习惯词样本中,计算新输入词的错误输入习惯词特征;判断用户是否为合法用户。本发明能够多维度地对用户输入行为特征进行身份验证,加强了验证过程的准确性以及安全性。

Description

一种基于用户输入行为特征的安全认证方法及***
技术领域
本发明涉及大数据中收集用户输入特征的技术领域,特别涉及一种基于用户输入行为特征的安全认证方法及***。
背景技术
当前基于用户输入行为的身份验证,基本都是采集用户敲击键盘的特性(如:敲击键盘的频率、压力大小、键盘的按下和松开的间隔等)来判断当前用户是否与已采集到的用户特征相匹配,从而验证当前用户是否合法。这种判断方式可归结到“击键动力学”的范畴。
但用户的输入特征,除了这些基本的“击键动力学”因素之外,其实还包括了用户的输入内容习惯,比如:用户会经常敲错某些词语,然后使用退格键进行纠正,重新输入;比如:用户对某些词语输入快一些,对某些词语输入会慢一些。
另外,如果只是采用单一的用户输入行为来对用户进行身份验证,会导致身份验证的安全性不高,以及总会发生验证不准确的情况。
发明内容
本发明要解决的技术问题在于,提供一种基于用户输入行为特征的安全认证方法及***,能够多维度以及多角度地对用户输入行为特征进行身份验证,加强了验证过程的准确性以及安全性。
为解决上述技术问题,本发明提供如下技术方案:一种基于用户输入行为特征的安全认证方法,包括以下步骤:
S1、设置限定采集统计时期,在限定采集统计时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
S2、对输入词划分成正常输入习惯词样本和错误输入习惯词样本;
S3、对正常输入习惯词样本,对各个输入词建立正确输入习惯行为特征坐标图,在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图;
S4、对错误输入习惯词样本,计算每个输入词的错误输入习惯词特征;
S5、限定采集统计时期过后,进入安全认证时期;在安全认证时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的新输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
S6、对新输入词划分新正常输入习惯词样本和新错误输入习惯词样本;
S7、对新正常输入习惯词样本,将新输入词代入步骤S3中输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内;
S8、在新错误输入习惯词样本中,计算每个新输入词的错误输入习惯词特征,判断新错误输入习惯词特征是否等于错误输入习惯词特征;
S9、根据新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及新错误输入习惯词特征是否等于错误输入习惯词特征,判断用户是否为合法用户。
进一步地,所述步骤S2,具体为:
在键盘上,收集经过26个英文字母按键进行拼写的输入词作为统计词组样本,把其它按键作为分隔符并且不纳入统计词组样本;其中,在统计词组样本中,剔除那些仅为单个英文字母按键的输入词;
对统计词组样本中的输入词,如果前后按键之间有触发回退按键的输入词,则将这些输入词划分为错误输入习惯词样本,否则划分为正常输入习惯词样本。
进一步地,所述步骤S3,具体为:
对正常输入习惯词样本,收集并计算每个输入词在按键拼写过程中的所花费时间,得到总输入耗时;对同一个输入词,记录其拼写次数并形成次序,以及记录其每一次的总输入耗时形成总输入耗时集合;
在正常输入习惯词样本中,对各个输入词建立正确输入习惯行为特征坐标图,具体为:
对同一个输入词,以其次序作为横坐标,并且在总输入耗时集合中选择次序对应的总输入耗时作为纵坐标,得到输入词的正确输入习惯行为特征坐标图;在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图。
进一步地,所述步骤S4,具体为:
对错误输入习惯词样本,记录每个输入词从最开始拼写错误到最终拼写正确过程中的错误按键序列信息,并记录最终拼写正确的输入词作为正确词;对同一个正确词,统计其拼写次数,并记录每一次拼写过程中的错误按键序列信息,并对所有错误按键序列信息按次序进行排列组合形成错误输入基础对;
计算错误输入习惯词特征,具体为:在错误输入习惯词样本中,对同一个正确词,统计错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成错误输入习惯词特征。
进一步地,所述步骤S6,具体为:
在键盘上,收集经过26个英文字母按键进行拼写的新输入词作为新统计词组样本,把其它按键作为分隔符并且不纳入新统计词组样本;其中,在新统计词组样本中,剔除那些仅为单个英文字母按键的新输入词;
对新统计词组样本中的新输入词,如果前后按键之间有触发回退按键的输入词,则将这些新输入词划分为新错误输入习惯词样本,否则划分为新正常输入习惯词样本。
进一步地,所述步骤S7,具体为:
对新正常输入习惯词样本,收集并计算每个输入词在按键拼写过程中的所花费时间,得到新总输入耗时;对同一个新输入词,记录其拼写次数并形成新次序,以及记录其每一次的总输入耗时形成总输入耗时集合;其中,若新输入词与限定采集统计时期内的输入词为同一词,则新输入词的新次序是在步骤S3中输入词的次序基础上进行累计;
对与限定采集统计时期的输入词为同一词的新输入词,将新输入词的新次序和新总输入耗时代入步骤S3中输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内。
进一步地,所述步骤S8,具体为:
在新错误输入习惯词样本中,记录每个新输入词从最开始拼写错误到最终拼写正确过程中的新错误按键序列信息,并记录最终拼写正确的新输入词作为新正确词;对同一个新正确词,统计其拼写次数,并记录每一次拼写过程中的新错误按键序列信息,并对所有新错误按键序列信息按次序进行排列组合形成新错误输入基础对;
计算新错误输入习惯词特征,具体为:在新错误输入习惯词样本中,对同一个新正确词,统计新错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成新错误输入习惯词特征;
对与限定采集统计时期的正确词为同一词的新正确词,判断新错误输入习惯词特征是否等于错误输入习惯词特征。
进一步地,所述步骤S9,具体为:
在安全认证时期内,若用户的新输入词只有新正常输入习惯词样本情况下,则判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内,若新输入词是位于正确输入习惯行为特征趋势图的趋势带内,则判定用户为合法用户;若新输入词是位于正确输入习惯行为特征趋势图的趋势带外,则判定用户为非法用户;
在安全认证时期内,若用户的新输入词只有新错误输入习惯词样本情况下,则判断新错误输入习惯词特征是否等于错误输入习惯词特征,若是则判定用户为合法用户,若否则判定用户为非法用户;
在安全认证时期内,若用户的新输入词既有新正常输入习惯词样本又有新错误输入习惯词样本的情况下,则判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及判断新错误输入习惯词特征是否等于错误输入习惯词特征,只有在新输入词位于正确输入习惯行为特征趋势图的趋势带内并且新错误输入习惯词特征等于错误输入习惯词特征的情况下,才会判定用户为合法,其他情况均判定用户为非法。
进一步地,所述步骤S9后还包括步骤S10、进行自适应学习,具体为:对合法用户的新正常输入习惯词样本的新输入词代入正确输入习惯行为特征趋势图,形成新的正确输入习惯行为特征趋势图,作为下一次合法用户判断的基础;对合法用户的新正确词的新错误输入习惯词特征加入至错误输入习惯词特征,作为下一次合法用户判断的基础。
本发明另一目的是提供一种基于用户输入行为特征的安全认证***,包括时间限定模块、键盘数据采集模块、输入词划分模块、特征趋势图构建模块、习惯词特征计算模块以及安全认证模块;
所述时间限定模块用于设定限定采集统计时期;
所述键盘数据采集模块用于:在限定采集统计时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
所述输入词划分模块用于对用户的输入词划分成正常输入习惯词样本和错误输入习惯词样本,具体为:输入词划分模块收集经过在键盘上26个英文字母按键进行拼写的输入词作为统计词组样本,把其它按键作为分隔符并且不纳入统计词组样本;其中,在统计词组样本中,输入词划分模块剔除那些仅为单个英文字母按键的输入词;对统计词组样本中的输入词,如果前后按键之间有触发回退按键的输入词,输入词划分模块则将这些输入词划分为错误输入习惯词样本,否则划分为正常输入习惯词样本;
所述特征趋势图构建模块用于:对正常输入习惯词样本,特征趋势图构建模块收集并计算每个输入词在按键拼写过程中的所花费时间,得到总输入耗时;对同一个输入词,特征趋势图构建模块记录其拼写次数并形成次序,以及记录其每一次的总输入耗时形成总输入耗时集合;在正常输入习惯词样本中,特征趋势图构建模块对各个输入词建立正确输入习惯行为特征坐标图,具体为:对同一个输入词,以其次序作为横坐标,并且在总输入耗时集合中选择次序对应的总输入耗时作为纵坐标,得到输入词的正确输入习惯行为特征坐标图;在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图;
所述习惯词特征计算模块用于对错误输入习惯词样本,计算每个输入词的错误输入习惯词特征,具体为:对错误输入习惯词样本,习惯词特征计算模块记录每个输入词从最开始拼写错误到最终拼写正确过程中的错误按键序列信息,并记录最终拼写正确的输入词作为正确词;对同一个正确词,习惯词特征计算模块统计其拼写次数,并记录每一次拼写过程中的错误按键序列信息,并对所有错误按键序列信息按次序进行排列组合形成错误输入基础对;在错误输入习惯词样本中,对同一个正确词,习惯词特征计算模块统计错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则习惯词特征计算模块将该回退键位置作为词出错习惯位置,并对其标志成错误输入习惯词特征;
所述时间限定模块还用于:限定采集统计时期过后,设定并进入安全认证时期;
所述键盘数据采集模块还用于:在安全认证时期内,键盘数据采集模块实时采集并记录用户敲击键盘的按键信息以及用户最终的新输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
所述输入词划分模块还用于对新输入词划分新正常输入习惯词样本和新错误输入习惯词样本,具体为:输入词划分模块收集经过在键盘上26个英文字母按键进行拼写的新输入词作为新统计词组样本,把其它按键作为分隔符并且不纳入新统计词组样本;其中,在新统计词组样本中,输入词划分模块剔除那些仅为单个英文字母按键的新输入词;对新统计词组样本中的新输入词,如果前后按键之间有触发回退按键的输入词,则输入词划分模块将这些新输入词划分为新错误输入习惯词样本,否则划分为新正常输入习惯词样本;
所述特征趋势图构建模块还用于:对新正常输入习惯词样本,将新输入词代入输入词的正确输入习惯行为特征趋势图中进行对比,具体为:对新正常输入习惯词样本,特征趋势图构建模块收集并计算每个输入词在按键拼写过程中的所花费时间,得到新总输入耗时;对同一个新输入词,特征趋势图构建模块记录其拼写次数并形成新次序,以及记录其每一次的总输入耗时形成总输入耗时集合;其中,若新输入词与限定采集统计时期内的输入词为同一词,则新输入词的新次序是在输入词的次序基础上进行累计;对与限定采集统计时期的输入词为同一词的新输入词,特征趋势图构建模块将新输入词的新次序和新总输入耗时代入输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内;
所述习惯词特征计算模块还用于:在新错误输入习惯词样本中,习惯词特征计算模块计算每个新输入词的错误输入习惯词特征;在新错误输入习惯词样本中,习惯词特征计算模块记录每个新输入词从最开始拼写错误到最终拼写正确过程中的新错误按键序列信息,并记录最终拼写正确的新输入词作为新正确词;对同一个新正确词,习惯词特征计算模块统计其拼写次数,并记录每一次拼写过程中的新错误按键序列信息,并对所有新错误按键序列信息按次序进行排列组合形成新错误输入基础对;在新错误输入习惯词样本中,对同一个新正确词,习惯词特征计算模块统计新错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成新错误输入习惯词特征;对与限定采集统计时期的正确词为同一词的新正确词,习惯词特征计算模块判断新错误输入习惯词特征是否等于错误输入习惯词特征;
所述安全认证模块用于:在安全认证时期内,若用户的新输入词只有新正常输入习惯词样本情况下,则安全认证模块判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内,若新输入词是位于正确输入习惯行为特征趋势图的趋势带内,则安全认证模块判定用户为合法用户;若新输入词是位于正确输入习惯行为特征趋势图的趋势带外,则安全认证模块判定用户为非法用户;在安全认证时期内,若用户的新输入词只有新错误输入习惯词样本情况下,则安全认证模块判断新错误输入习惯词特征是否等于错误输入习惯词特征,若是则安全认证模块判定用户为合法用户,若否则安全认证模块判定用户为非法用户;在安全认证时期内,若用户的新输入词既有新正常输入习惯词样本又有新错误输入习惯词样本的情况下,则安全认证模块判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及判断新错误输入习惯词特征是否等于错误输入习惯词特征,只有在新输入词位于正确输入习惯行为特征趋势图的趋势带内并且新错误输入习惯词特征等于错误输入习惯词特征的情况下,安全认证模块才会判定用户为合法,其他情况均判定用户为非法。
进一步地,所述一种基于用户输入行为特征的安全认证***,还包括自学习模块,所述自学习模块用于进行自适应学习,具体为:自学习模块对合法用户的新正常输入习惯词样本的新输入词代入正确输入习惯行为特征趋势图,形成新的正确输入习惯行为特征趋势图,作为下一次合法用户判断的基础;自学习模块对合法用户的新正确词的新错误输入习惯词特征加入至错误输入习惯词特征,作为下一次合法用户判断的基础。
采用上述技术方案后,本发明至少具有如下有益效果:本发明通过对输入词的正确输入习惯行为特征趋势图以及错误输入习惯词特征这两个角度结合进行用户合法性的判断,能够更加准确地定位到合法用户以及非法用户,能够及时发现非法用户从而大大提高***的安全性;本发明通过自学习模块,能够源源不断地进行安全数据的完善以及提升,提升用户的体验;本发明具有自我学习的能力,以便可以自动适应用户不断改变的输入行为习惯;本发明用户的输入行为,往往具备内容相关性,而基于此的输入行为的身份识别,会更具有代表性和更难的复制性。
附图说明
图1为本发明一种基于用户输入行为特征的安全认证方法步骤流程图。
图2-图6为本发明实施例1中举例的正确输入习惯行为特征坐标图。
图7-图11为本发明实施例1中举例的正确输入习惯行为特征趋势图。
图12和图13为本发明实施例1举例的新输入词在正确输入习惯行为特征趋势图中的分布趋势图。
图14和图15为本发明实施例1举例的新输入词在正确输入习惯行为特征趋势图外的分布趋势图。
图16为本发明一种基于用户输入行为特征的安全认证***框架图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本申请作进一步详细说明。
实施例1
如图1所示,本实施例提供一种基于用户输入行为特征的安全认证方法,具体步骤包括:
S1、设置限定采集统计时期,在限定采集统计时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;在这里,限定采集统计时期可以设定为24小时内,也可以设定为12小时或者48小时等等,按照采样的多少从而根据实际情况进行设定,另外,限定采集统计时期也可以作为一次的开机到关机这段时间内作为限定采集统计时期,也可以是两次的开机到关机这段时间内作为限定采集统计时期等等;
其中,按键信息具体举例为:用户敲击键盘上按键g、按键o、按键o、按键o、按键d,则输入词就是good,按键值分别就是g、o、o、d,并以如下数据格式记录下来<按键值,当前时间戳>,标记为原始按键样本,例如<g,0.01ms>;“当前时间戳”单位为毫秒,该值=***开机时间到该按键按下的时间差由于无法获取键盘敲击触发的瞬间绝对时间值,因此对当前时间戳只能使用相对时间,即当前时间戳为***开机时间到该按键按下的时间差;多条原始按键样本组合成“原始按键库”;
S2、对输入词划分成正常输入习惯词样本和错误输入习惯词样本,具体为:
在键盘上,收集经过26个英文字母按键进行拼写的输入词作为统计词组样本,把其它按键作为分隔符并且不纳入统计词组样本;其中,在统计词组样本中,剔除那些仅为单个英文字母按键的输入词;
对统计词组样本中的输入词,如果前后按键之间有触发回退按键的输入词,则将这些输入词划分为错误输入习惯词样本,否则划分为正常输入习惯词样本;
S3、对正常输入习惯词样本,对各个输入词建立正确输入习惯行为特征坐标图,在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图;此步骤具体为:
对正常输入习惯词样本,收集并计算每个输入词在按键拼写过程中的所花费时间,得到总输入耗时;计算每个输入词各相邻键盘间耗时,以如下格式记录<输入词,总输入耗时,各相邻键盘间耗时>,标记为“正常输入词耗时对”;其中,“总输入耗时”=该词最后一个按键的当前时间戳-该词第一个按键的当前时间戳,“各相邻键盘间耗时”=第2个按键的当前时间戳-第1个按键的当前时间戳,第3个按键的当前时间戳-第2个按键的当前时间戳,...,第n个按键的当前时间戳-第(n-1)个按键的当前时间戳;词的多个“正常输入词耗时对”组合成为“正确输入基础对”;
对同一个输入词,记录其拼写次数并形成次序,以及记录其每一次的总输入耗时形成总输入耗时集合;例如,输入词为good,其第一次输入则次序为1,第二次输入次序为2,依次类推,次序为:1、2、3、4、5、6、…、n;
在正常输入习惯词样本中,对各个输入词建立正确输入习惯行为特征坐标图,具体为:
对同一个输入词,以其次序作为横坐标,并且在总输入耗时集合中选择次序对应的总输入耗时作为纵坐标,得到输入词的正确输入习惯行为特征坐标图;在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图;例如,对同一个输入词为good,对于不同用户有不同的正确输入习惯行为特征坐标图,如图2至图6,可根据如图2至图6的各个正确输入习惯行为特征坐标图中的坐标点,可以直接对应得到和画出正确输入习惯行为特征趋势图,如图7至图11;需要说明的是,考虑到用户的习惯性输入具有稳定性和逐步熟练性,图5和图6这两种情况基本不会出现,对应地图10和图11也不会出现;由图2可得,用户的输入习惯比较稳定;由图3可得,用户的输入习惯逐渐熟练;由图4可得,用户的输入习惯从逐步熟练到趋向稳定;
S4、对错误输入习惯词样本,计算每个输入词的错误输入习惯词特征,具体为:
对错误输入习惯词样本,记录每个输入词从最开始拼写错误到最终拼写正确过程中的错误按键序列信息,并记录最终拼写正确的输入词作为正确词;对同一个正确词,统计其拼写次数,并记录每一次拼写过程中的错误按键序列信息,并对所有错误按键序列信息按次序进行排列组合形成错误输入基础对;下面进行举例:
举例1,用户输入了英文单词“good“(备注:不包含双引号),用户按键方式为(按键g,按键o,按键o,按键o,回退键,按键d);
举例2,用户使用拼音输入法输入“中国”(备注:不包含双引号),用户的按键方式为(按键z,按键h,按键o,按键n,按键g,按键g,按键o,按键u,回退键,回退键,按键u,按键o);
则举例1的按键序列信息为(按键g,按键o,按键o,回退键1次,按键d),也就是错误按键序列信息;
则举例2的按键序列信息为(按键z,按键h,按键o,按键n,按键g,按键g,回退键2次,按键u,按键o),也就是错误按键序列信息;
按原则进行统计:保留正确按键,记录相邻回退按键累计次数;同时根据回退键次数和位置,计算出所输入的正确词;
“错误输入词习惯对”格式为:<正确词,错误按键序列信息>
同一个输入词的多个“错误输入词习惯对”组合成为“错误输入基础对”
计算错误输入习惯词特征,具体为:在错误输入习惯词样本中,对同一个正确词,统计错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成错误输入习惯词特征;本实施例的限定比例优先为50%;
举例子:用户想输入单词“good”(备注:不包含双引号,单词“good”也就是输入词也是最终输入正确的正确词),由于习惯性错误,经常出现多输入字母o,然后回退修正,于是形成了如下一些的“错误输入词习惯对”,此处可将输入100次的单词“good”,作为统计数量:
<good,<按键g,按键o,按键o,回退1次,按键d>>
<good,<按键g,按键o,按键o,回退1次,按键d>>
<good,<按键g,按键o,按键o,回退2次,按键d>>
<good,<按键g,按键o,按键o,回退1次,按键d>>
<good,<按键g,按键o,按键o,回退2次,按键d>>
<good,<按键g,按键o,按键o,回退2次,按键d>>
<good,<按键g,按键o,按键o,回退1次,按键d>>
<good,<按键g,回退1次,按键o,按键o,按键d>>
..........
统计得出,在该词第4个位置出错的概率为95%,其它位置出错的概率为5%。
那么该词的"错误输入习惯词特征"为<good,4>;
S5、限定采集统计时期过后,进入安全认证时期;在安全认证时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的新输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;实际上,此处的实时采集并记录用户敲击键盘的按键信息以及用户最终的新输入词,过程跟步骤S1是一样的,为了下面描述能有更好的区分,把步骤S1的输入词在此步骤称为新输入词;
其中,同样的,安全认证时期可以根据限定采集统计时期进行设置,可以设定为24小时内,也可以设定为12小时或者48小时等等,按照采样的多少从而根据实际情况进行设定,另外,安全认证时期也可以作为一次的开机到关机这段时间内作为限定采集统计时期,也可以是两次的开机到关机这段时间内作为安全认证时期等等;
S6、对新输入词划分新正常输入习惯词样本和新错误输入习惯词样本,具体为:
在键盘上,收集经过26个英文字母按键进行拼写的新输入词作为新统计词组样本,把其它按键作为分隔符并且不纳入新统计词组样本;其中,在新统计词组样本中,剔除那些仅为单个英文字母按键的新输入词;
对新统计词组样本中的新输入词,如果前后按键之间有触发回退按键的输入词,则将这些新输入词划分为新错误输入习惯词样本,否则划分为新正常输入习惯词样本;
S7、对新正常输入习惯词样本,将新输入词代入步骤S3中输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内;具体为:
对新正常输入习惯词样本,收集并计算每个输入词在按键拼写过程中的所花费时间,得到新总输入耗时;对同一个新输入词,记录其拼写次数并形成新次序,以及记录其每一次的总输入耗时形成总输入耗时集合;其中,若新输入词与限定采集统计时期内的输入词为同一词,则新输入词的新次序是在步骤S3中输入词的次序基础上进行累计,例如在限定采集统计时期内,输入词“good”总共统计输入了100次,那么输入词的次序就为100,而新输入词也为“good”时,则新输入词的新次序是在100次数往上相加的,例如新次序的次数在安全认证时期内总共统计了50次,那么新次序则为150;
对与限定采集统计时期的输入词为同一词的新输入词,将新输入词的新次序和新总输入耗时代入步骤S3中输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内;
S8、在新错误输入习惯词样本中,计算每个新输入词的错误输入习惯词特征,判断新错误输入习惯词特征是否等于错误输入习惯词特征;此步骤可参考上述步骤S4,具体为:
在新错误输入习惯词样本中,记录每个新输入词从最开始拼写错误到最终拼写正确过程中的新错误按键序列信息,并记录最终拼写正确的新输入词作为新正确词;对同一个新正确词,统计其拼写次数,并记录每一次拼写过程中的新错误按键序列信息,并对所有新错误按键序列信息按次序进行排列组合形成新错误输入基础对;
计算新错误输入习惯词特征,具体为:在新错误输入习惯词样本中,对同一个新正确词,统计新错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成新错误输入习惯词特征;此步骤的限定比例与步骤S4的限定比例一致,均优先设置为50%;
对与限定采集统计时期的正确词为同一词的新正确词,判断新错误输入习惯词特征是否等于错误输入习惯词特征;
S9、根据新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及新错误输入习惯词特征是否等于错误输入习惯词特征,判断用户是否为合法用户,具体为:
在安全认证时期内,若用户的新输入词只有新正常输入习惯词样本情况下,则判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内,若新输入词是位于正确输入习惯行为特征趋势图的趋势带内,则判定用户为合法用户,如图12和图13所示,虚框代表安全认证时期内内新输入词的分布范围,实框代表限定采集统计时期内输入词的分布范围,直接在图中判断到虚框位于实框的趋势带内;若新输入词是位于正确输入习惯行为特征趋势图的趋势带外,则判定用户为非法用户,如图14和图15所示,虚框代表安全认证时期内内新输入词的分布范围,实框代表限定采集统计时期内输入词的分布范围,直接在图中判断到虚框位于实框的趋势带外;
在安全认证时期内,若用户的新输入词只有新错误输入习惯词样本情况下,则判断新错误输入习惯词特征是否等于错误输入习惯词特征,若是则判定用户为合法用户,若否则判定用户为非法用户;
例如用户经常拼写错误的词为“good”,其输入词的"错误输入习惯词特征"为<good,4>,而新输入词的"错误输入习惯词特征"也为<good,4>,则判定用户为合法用户;而输入词的"错误输入习惯词特征"为<good,4>,但新输入词的"错误输入习惯词特征"也为<good,5>,两者的"错误输入习惯词特征"不一致,则判定用户为非法用户;
在安全认证时期内,若用户的新输入词既有新正常输入习惯词样本又有新错误输入习惯词样本的情况下,则判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及判断新错误输入习惯词特征是否等于错误输入习惯词特征,只有在新输入词位于正确输入习惯行为特征趋势图的趋势带内并且新错误输入习惯词特征等于错误输入习惯词特征的情况下,才会判定用户为合法,其他情况均判定用户为非法;
S10、进行自适应学习,具体为:对合法用户的新正常输入习惯词样本的新输入词代入正确输入习惯行为特征趋势图,形成新的正确输入习惯行为特征趋势图,作为下一次合法用户判断的基础;对合法用户的新正确词的新错误输入习惯词特征加入至错误输入习惯词特征,作为下一次合法用户判断的基础。
实施例2
本实施例是在实施例1的基础上提供一种基于用户输入行为特征的安全认证***,其运用于计算机***内,如图16所示具体包括:时间限定模块、键盘数据采集模块、输入词划分模块、特征趋势图构建模块、习惯词特征计算模块、安全认证模块以及自学习模块;
所述时间限定模块用于设定限定采集统计时期;
所述键盘数据采集模块用于:在限定采集统计时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
所述输入词划分模块用于对用户的输入词划分成正常输入习惯词样本和错误输入习惯词样本,具体为:输入词划分模块收集经过在键盘上26个英文字母按键进行拼写的输入词作为统计词组样本,把其它按键作为分隔符并且不纳入统计词组样本;其中,在统计词组样本中,输入词划分模块剔除那些仅为单个英文字母按键的输入词;对统计词组样本中的输入词,如果前后按键之间有触发回退按键的输入词,输入词划分模块则将这些输入词划分为错误输入习惯词样本,否则划分为正常输入习惯词样本;
所述特征趋势图构建模块用于:对正常输入习惯词样本,特征趋势图构建模块收集并计算每个输入词在按键拼写过程中的所花费时间,得到总输入耗时;对同一个输入词,特征趋势图构建模块记录其拼写次数并形成次序,以及记录其每一次的总输入耗时形成总输入耗时集合;在正常输入习惯词样本中,特征趋势图构建模块对各个输入词建立正确输入习惯行为特征坐标图,具体为:对同一个输入词,以其次序作为横坐标,并且在总输入耗时集合中选择次序对应的总输入耗时作为纵坐标,得到输入词的正确输入习惯行为特征坐标图;在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图;
所述习惯词特征计算模块用于对错误输入习惯词样本,计算每个输入词的错误输入习惯词特征,具体为:对错误输入习惯词样本,习惯词特征计算模块记录每个输入词从最开始拼写错误到最终拼写正确过程中的错误按键序列信息,并记录最终拼写正确的输入词作为正确词;对同一个正确词,习惯词特征计算模块统计其拼写次数,并记录每一次拼写过程中的错误按键序列信息,并对所有错误按键序列信息按次序进行排列组合形成错误输入基础对;在错误输入习惯词样本中,对同一个正确词,习惯词特征计算模块统计错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则习惯词特征计算模块将该回退键位置作为词出错习惯位置,并对其标志成错误输入习惯词特征;
所述时间限定模块还用于:限定采集统计时期过后,设定并进入安全认证时期;
所述键盘数据采集模块还用于:在安全认证时期内,键盘数据采集模块实时采集并记录用户敲击键盘的按键信息以及用户最终的新输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
所述输入词划分模块还用于对新输入词划分新正常输入习惯词样本和新错误输入习惯词样本,具体为:输入词划分模块收集经过在键盘上26个英文字母按键进行拼写的新输入词作为新统计词组样本,把其它按键作为分隔符并且不纳入新统计词组样本;其中,在新统计词组样本中,输入词划分模块剔除那些仅为单个英文字母按键的新输入词;对新统计词组样本中的新输入词,如果前后按键之间有触发回退按键的输入词,则输入词划分模块将这些新输入词划分为新错误输入习惯词样本,否则划分为新正常输入习惯词样本;
所述特征趋势图构建模块还用于:对新正常输入习惯词样本,将新输入词代入输入词的正确输入习惯行为特征趋势图中进行对比,具体为:对新正常输入习惯词样本,特征趋势图构建模块收集并计算每个输入词在按键拼写过程中的所花费时间,得到新总输入耗时;对同一个新输入词,特征趋势图构建模块记录其拼写次数并形成新次序,以及记录其每一次的总输入耗时形成总输入耗时集合;其中,若新输入词与限定采集统计时期内的输入词为同一词,则新输入词的新次序是在输入词的次序基础上进行累计;对与限定采集统计时期的输入词为同一词的新输入词,特征趋势图构建模块将新输入词的新次序和新总输入耗时代入输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内;
所述习惯词特征计算模块还用于:在新错误输入习惯词样本中,习惯词特征计算模块计算每个新输入词的错误输入习惯词特征;在新错误输入习惯词样本中,习惯词特征计算模块记录每个新输入词从最开始拼写错误到最终拼写正确过程中的新错误按键序列信息,并记录最终拼写正确的新输入词作为新正确词;对同一个新正确词,习惯词特征计算模块统计其拼写次数,并记录每一次拼写过程中的新错误按键序列信息,并对所有新错误按键序列信息按次序进行排列组合形成新错误输入基础对;在新错误输入习惯词样本中,对同一个新正确词,习惯词特征计算模块统计新错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成新错误输入习惯词特征;对与限定采集统计时期的正确词为同一词的新正确词,习惯词特征计算模块判断新错误输入习惯词特征是否等于错误输入习惯词特征;
所述安全认证模块用于:在安全认证时期内,若用户的新输入词只有新正常输入习惯词样本情况下,则安全认证模块判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内,若新输入词是位于正确输入习惯行为特征趋势图的趋势带内,则安全认证模块判定用户为合法用户;若新输入词是位于正确输入习惯行为特征趋势图的趋势带外,则安全认证模块判定用户为非法用户;在安全认证时期内,若用户的新输入词只有新错误输入习惯词样本情况下,则安全认证模块判断新错误输入习惯词特征是否等于错误输入习惯词特征,若是则安全认证模块判定用户为合法用户,若否则安全认证模块判定用户为非法用户;在安全认证时期内,若用户的新输入词既有新正常输入习惯词样本又有新错误输入习惯词样本的情况下,则安全认证模块判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及判断新错误输入习惯词特征是否等于错误输入习惯词特征,只有在新输入词位于正确输入习惯行为特征趋势图的趋势带内并且新错误输入习惯词特征等于错误输入习惯词特征的情况下,安全认证模块才会判定用户为合法,其他情况均判定用户为非法;
所述自学习模块用于进行自适应学习,具体为:自学习模块对合法用户的新正常输入习惯词样本的新输入词代入正确输入习惯行为特征趋势图,形成新的正确输入习惯行为特征趋势图,作为下一次合法用户判断的基础;自学习模块对合法用户的新正确词的新错误输入习惯词特征加入至错误输入习惯词特征,作为下一次合法用户判断的基础。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

Claims (10)

1.一种基于用户输入行为特征的安全认证方法,其特征在于,包括以下步骤:
S1、设置限定采集统计时期,在限定采集统计时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
S2、对输入词划分成正常输入习惯词样本和错误输入习惯词样本;
S3、对正常输入习惯词样本,对各个输入词建立正确输入习惯行为特征坐标图,在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图;
S4、对错误输入习惯词样本,计算每个输入词的错误输入习惯词特征,具体为:对错误输入习惯词样本,记录每个输入词从最开始拼写错误到最终拼写正确过程中的错误按键序列信息,并记录最终拼写正确的输入词作为正确词;对同一个正确词,统计其拼写次数,并记录每一次拼写过程中的错误按键序列信息,并对所有错误按键序列信息按次序进行排列组合形成错误输入基础对;
计算错误输入习惯词特征,具体为:在错误输入习惯词样本中,对同一个正确词,统计错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成错误输入习惯词特征;
S5、限定采集统计时期过后,进入安全认证时期;在安全认证时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的新输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
S6、对新输入词划分新正常输入习惯词样本和新错误输入习惯词样本;
S7、对新正常输入习惯词样本,将新输入词代入步骤S3中输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内;
S8、在新错误输入习惯词样本中,计算每个新输入词的错误输入习惯词特征,判断新错误输入习惯词特征是否等于错误输入习惯词特征;
S9、根据新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及新错误输入习惯词特征是否等于错误输入习惯词特征,判断用户是否为合法用户。
2.根据权利要求1所述的一种基于用户输入行为特征的安全认证方法,其特征在于,所述步骤S2,具体为:
在键盘上,收集经过26个英文字母按键进行拼写的输入词作为统计词组样本,把其它按键作为分隔符并且不纳入统计词组样本;其中,在统计词组样本中,剔除那些仅为单个英文字母按键的输入词;
对统计词组样本中的输入词,如果前后按键之间有触发回退按键的输入词,则将这些输入词划分为错误输入习惯词样本,否则划分为正常输入习惯词样本。
3.根据权利要求1所述的一种基于用户输入行为特征的安全认证方法,其特征在于,所述步骤S3,具体为:
对正常输入习惯词样本,收集并计算每个输入词在按键拼写过程中的所花费时间,得到总输入耗时;对同一个输入词,记录其拼写次数并形成次序,以及记录其每一次的总输入耗时形成总输入耗时集合;
在正常输入习惯词样本中,对各个输入词建立正确输入习惯行为特征坐标图,具体为:
对同一个输入词,以其次序作为横坐标,并且在总输入耗时集合中选择次序对应的总输入耗时作为纵坐标,得到输入词的正确输入习惯行为特征坐标图;在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图。
4.根据权利要求1所述的一种基于用户输入行为特征的安全认证方法,其特征在于,所述步骤S6,具体为:
在键盘上,收集经过26个英文字母按键进行拼写的新输入词作为新统计词组样本,把其它按键作为分隔符并且不纳入新统计词组样本;其中,在新统计词组样本中,剔除那些仅为单个英文字母按键的新输入词;
对新统计词组样本中的新输入词,如果前后按键之间有触发回退按键的输入词,则将这些新输入词划分为新错误输入习惯词样本,否则划分为新正常输入习惯词样本。
5.根据权利要求3所述的一种基于用户输入行为特征的安全认证方法,其特征在于,所述步骤S7,具体为:
对新正常输入习惯词样本,收集并计算每个输入词在按键拼写过程中的所花费时间,得到新总输入耗时;对同一个新输入词,记录其拼写次数并形成新次序,以及记录其每一次的总输入耗时形成总输入耗时集合;其中,若新输入词与限定采集统计时期内的输入词为同一词,则新输入词的新次序是在步骤S3中输入词的次序基础上进行累计;
对与限定采集统计时期的输入词为同一词的新输入词,将新输入词的新次序和新总输入耗时代入步骤S3中输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内。
6.根据权利要求1所述的一种基于用户输入行为特征的安全认证方法,其特征在于,所述步骤S8,具体为:
在新错误输入习惯词样本中,记录每个新输入词从最开始拼写错误到最终拼写正确过程中的新错误按键序列信息,并记录最终拼写正确的新输入词作为新正确词;对同一个新正确词,统计其拼写次数,并记录每一次拼写过程中的新错误按键序列信息,并对所有新错误按键序列信息按次序进行排列组合形成新错误输入基础对;
计算新错误输入习惯词特征,具体为:在新错误输入习惯词样本中,对同一个新正确词,统计新错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成新错误输入习惯词特征;
对与限定采集统计时期的正确词为同一词的新正确词,判断新错误输入习惯词特征是否等于错误输入习惯词特征。
7.根据权利要求1所述的一种基于用户输入行为特征的安全认证方法,其特征在于,所述步骤S9,具体为:
在安全认证时期内,若用户的新输入词只有新正常输入习惯词样本情况下,则判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内,若新输入词是位于正确输入习惯行为特征趋势图的趋势带内,则判定用户为合法用户;若新输入词是位于正确输入习惯行为特征趋势图的趋势带外,则判定用户为非法用户;
在安全认证时期内,若用户的新输入词只有新错误输入习惯词样本情况下,则判断新错误输入习惯词特征是否等于错误输入习惯词特征,若是则判定用户为合法用户,若否则判定用户为非法用户;
在安全认证时期内,若用户的新输入词既有新正常输入习惯词样本又有新错误输入习惯词样本的情况下,则判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及判断新错误输入习惯词特征是否等于错误输入习惯词特征,只有在新输入词位于正确输入习惯行为特征趋势图的趋势带内并且新错误输入习惯词特征等于错误输入习惯词特征的情况下,才会判定用户为合法,其他情况均判定用户为非法。
8.根据权利要求1所述的一种基于用户输入行为特征的安全认证方法,其特征在于,所述步骤S9后还包括步骤S10、进行自适应学习,具体为:对合法用户的新正常输入习惯词样本的新输入词代入正确输入习惯行为特征趋势图,形成新的正确输入习惯行为特征趋势图,作为下一次合法用户判断的基础;对合法用户的新正确词的新错误输入习惯词特征加入至错误输入习惯词特征,作为下一次合法用户判断的基础。
9.一种基于用户输入行为特征的安全认证***,其特征在于,包括时间限定模块、键盘数据采集模块、输入词划分模块、特征趋势图构建模块、习惯词特征计算模块以及安全认证模块;
所述时间限定模块用于设定限定采集统计时期;
所述键盘数据采集模块用于:在限定采集统计时期内,实时采集并记录用户敲击键盘的按键信息以及用户最终的输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
所述输入词划分模块用于对用户的输入词划分成正常输入习惯词样本和错误输入习惯词样本,具体为:输入词划分模块收集经过在键盘上26个英文字母按键进行拼写的输入词作为统计词组样本,把其它按键作为分隔符并且不纳入统计词组样本;其中,在统计词组样本中,输入词划分模块剔除那些仅为单个英文字母按键的输入词;对统计词组样本中的输入词,如果前后按键之间有触发回退按键的输入词,输入词划分模块则将这些输入词划分为错误输入习惯词样本,否则划分为正常输入习惯词样本;
所述特征趋势图构建模块用于:对正常输入习惯词样本,特征趋势图构建模块收集并计算每个输入词在按键拼写过程中的所花费时间,得到总输入耗时;对同一个输入词,特征趋势图构建模块记录其拼写次数并形成次序,以及记录其每一次的总输入耗时形成总输入耗时集合;在正常输入习惯词样本中,特征趋势图构建模块对各个输入词建立正确输入习惯行为特征坐标图,具体为:对同一个输入词,以其次序作为横坐标,并且在总输入耗时集合中选择次序对应的总输入耗时作为纵坐标,得到输入词的正确输入习惯行为特征坐标图;在正确输入习惯行为特征坐标图上得到同一个输入词的正确输入习惯行为特征趋势图;
所述习惯词特征计算模块用于对错误输入习惯词样本,计算每个输入词的错误输入习惯词特征,具体为:对错误输入习惯词样本,习惯词特征计算模块记录每个输入词从最开始拼写错误到最终拼写正确过程中的错误按键序列信息,并记录最终拼写正确的输入词作为正确词;对同一个正确词,习惯词特征计算模块统计其拼写次数,并记录每一次拼写过程中的错误按键序列信息,并对所有错误按键序列信息按次序进行排列组合形成错误输入基础对;在错误输入习惯词样本中,对同一个正确词,习惯词特征计算模块统计错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则习惯词特征计算模块将该回退键位置作为词出错习惯位置,并对其标志成错误输入习惯词特征;
所述时间限定模块还用于:限定采集统计时期过后,设定并进入安全认证时期;
所述键盘数据采集模块还用于:在安全认证时期内,键盘数据采集模块实时采集并记录用户敲击键盘的按键信息以及用户最终的新输入词,按键信息包括按键值和按键按下瞬间的当前时间戳;
所述输入词划分模块还用于对新输入词划分新正常输入习惯词样本和新错误输入习惯词样本,具体为:输入词划分模块收集经过在键盘上26个英文字母按键进行拼写的新输入词作为新统计词组样本,把其它按键作为分隔符并且不纳入新统计词组样本;其中,在新统计词组样本中,输入词划分模块剔除那些仅为单个英文字母按键的新输入词;对新统计词组样本中的新输入词,如果前后按键之间有触发回退按键的输入词,则输入词划分模块将这些新输入词划分为新错误输入习惯词样本,否则划分为新正常输入习惯词样本;
所述特征趋势图构建模块还用于:对新正常输入习惯词样本,将新输入词代入输入词的正确输入习惯行为特征趋势图中进行对比,具体为:对新正常输入习惯词样本,特征趋势图构建模块收集并计算每个输入词在按键拼写过程中的所花费时间,得到新总输入耗时;对同一个新输入词,特征趋势图构建模块记录其拼写次数并形成新次序,以及记录其每一次的总输入耗时形成总输入耗时集合;其中,若新输入词与限定采集统计时期内的输入词为同一词,则新输入词的新次序是在输入词的次序基础上进行累计;对与限定采集统计时期的输入词为同一词的新输入词,特征趋势图构建模块将新输入词的新次序和新总输入耗时代入输入词的正确输入习惯行为特征趋势图中进行对比,用于判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内;
所述习惯词特征计算模块还用于:在新错误输入习惯词样本中,习惯词特征计算模块计算每个新输入词的错误输入习惯词特征;在新错误输入习惯词样本中,习惯词特征计算模块记录每个新输入词从最开始拼写错误到最终拼写正确过程中的新错误按键序列信息,并记录最终拼写正确的新输入词作为新正确词;对同一个新正确词,习惯词特征计算模块统计其拼写次数,并记录每一次拼写过程中的新错误按键序列信息,并对所有新错误按键序列信息按次序进行排列组合形成新错误输入基础对;在新错误输入习惯词样本中,对同一个新正确词,习惯词特征计算模块统计新错误输入基础对中出现回退键位置的概率,若其中一个回退键位置的概率超过限定比例,则将该回退键位置作为词出错习惯位置,并对其标志成新错误输入习惯词特征;对与限定采集统计时期的正确词为同一词的新正确词,习惯词特征计算模块判断新错误输入习惯词特征是否等于错误输入习惯词特征;
所述安全认证模块用于:在安全认证时期内,若用户的新输入词只有新正常输入习惯词样本情况下,则安全认证模块判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内,若新输入词是位于正确输入习惯行为特征趋势图的趋势带内,则安全认证模块判定用户为合法用户;若新输入词是位于正确输入习惯行为特征趋势图的趋势带外,则安全认证模块判定用户为非法用户;在安全认证时期内,若用户的新输入词只有新错误输入习惯词样本情况下,则安全认证模块判断新错误输入习惯词特征是否等于错误输入习惯词特征,若是则安全认证模块判定用户为合法用户,若否则安全认证模块判定用户为非法用户;在安全认证时期内,若用户的新输入词既有新正常输入习惯词样本又有新错误输入习惯词样本的情况下,则安全认证模块判断新输入词是否位于正确输入习惯行为特征趋势图的趋势带内以及判断新错误输入习惯词特征是否等于错误输入习惯词特征,只有在新输入词位于正确输入习惯行为特征趋势图的趋势带内并且新错误输入习惯词特征等于错误输入习惯词特征的情况下,安全认证模块才会判定用户为合法,其他情况均判定用户为非法。
10.根据权利要求9所述的一种基于用户输入行为特征的安全认证***,其特征在于,还包括自学习模块,所述自学习模块用于进行自适应学习,具体为:自学习模块对合法用户的新正常输入习惯词样本的新输入词代入正确输入习惯行为特征趋势图,形成新的正确输入习惯行为特征趋势图,作为下一次合法用户判断的基础;自学习模块对合法用户的新正确词的新错误输入习惯词特征加入至错误输入习惯词特征,作为下一次合法用户判断的基础。
CN202010829531.7A 2020-08-18 2020-08-18 一种基于用户输入行为特征的安全认证方法及*** Active CN111737668B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010829531.7A CN111737668B (zh) 2020-08-18 2020-08-18 一种基于用户输入行为特征的安全认证方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010829531.7A CN111737668B (zh) 2020-08-18 2020-08-18 一种基于用户输入行为特征的安全认证方法及***

Publications (2)

Publication Number Publication Date
CN111737668A CN111737668A (zh) 2020-10-02
CN111737668B true CN111737668B (zh) 2020-12-11

Family

ID=72658534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010829531.7A Active CN111737668B (zh) 2020-08-18 2020-08-18 一种基于用户输入行为特征的安全认证方法及***

Country Status (1)

Country Link
CN (1) CN111737668B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118094532B (zh) * 2024-04-29 2024-07-09 曙光信息产业(北京)有限公司 一种处理存储硬件智能防护方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332932B2 (en) * 2007-12-07 2012-12-11 Scout Analytics, Inc. Keystroke dynamics authentication techniques
CN104301286A (zh) * 2013-07-15 2015-01-21 ***通信集团黑龙江有限公司 用户登录认证方法及装置
CN106570367A (zh) * 2016-11-14 2017-04-19 北京爱知之星科技股份有限公司 基于键盘操作的用户身份识别方法和装置
CN109101793A (zh) * 2018-07-12 2018-12-28 方书田 一种基于静态文本击键特征的身份识别方法及***
US10235507B1 (en) * 2015-04-20 2019-03-19 Intensity Analytics Corporation Authentication via typing cadence, gestures, and QR codes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332932B2 (en) * 2007-12-07 2012-12-11 Scout Analytics, Inc. Keystroke dynamics authentication techniques
CN104301286A (zh) * 2013-07-15 2015-01-21 ***通信集团黑龙江有限公司 用户登录认证方法及装置
US10235507B1 (en) * 2015-04-20 2019-03-19 Intensity Analytics Corporation Authentication via typing cadence, gestures, and QR codes
CN106570367A (zh) * 2016-11-14 2017-04-19 北京爱知之星科技股份有限公司 基于键盘操作的用户身份识别方法和装置
CN109101793A (zh) * 2018-07-12 2018-12-28 方书田 一种基于静态文本击键特征的身份识别方法及***

Also Published As

Publication number Publication date
CN111737668A (zh) 2020-10-02

Similar Documents

Publication Publication Date Title
CN108376151B (zh) 问题分类方法、装置、计算机设备和存储介质
WO2020253350A1 (zh) 网络内容发布的审核方法、装置、计算机设备及存储介质
US10152139B2 (en) Autocompletion method and system
US8028230B2 (en) Contextual input method
US20150309984A1 (en) Learning language models from scratch based on crowd-sourced user text input
CN103729474B (zh) 用于识别论坛用户马甲账号的方法和***
US20180067920A1 (en) Dictionary updating apparatus, dictionary updating method and computer program product
CN111079412A (zh) 文本纠错方法及装置
US9852122B2 (en) Method of automated analysis of text documents
JP7149721B2 (ja) 情報処理装置、文字認識エンジン最適化方法及びプログラム
CN108984493B (zh) 一种中文文章查重方法和***
CN103365573A (zh) 一种对多键输入字符进行识别的方法和装置
CN111708942B (zh) 多媒体资源推送方法、装置、服务器及存储介质
CN110389941B (zh) 数据库校验方法、装置、设备及存储介质
CN111737668B (zh) 一种基于用户输入行为特征的安全认证方法及***
CN112883734A (zh) 区块链安全事件舆情监测方法及***
CN111046627B (zh) 一种中文文字显示方法及***
CN111950267B (zh) 文本三元组的抽取方法及装置、电子设备及存储介质
CN112699671B (zh) 一种语言标注方法、装置、计算机设备和存储介质
CN111291535B (zh) 剧本处理方法、装置、电子设备及计算机可读存储介质
CN112163400B (zh) 信息处理方法及装置
CN110807322B (zh) 基于信息熵识别新词的方法、装置、服务器及存储介质
JP4278011B2 (ja) 文書校正装置およびプログラム記憶媒体
CN113609864A (zh) 一种基于工业控制***的文本语义识别处理***及方法
JP4047895B2 (ja) 文書校正装置およびプログラム記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant