CN107194216A - 一种基于用户划屏习惯的移动身份认证方法及*** - Google Patents

一种基于用户划屏习惯的移动身份认证方法及*** Download PDF

Info

Publication number
CN107194216A
CN107194216A CN201710313695.2A CN201710313695A CN107194216A CN 107194216 A CN107194216 A CN 107194216A CN 201710313695 A CN201710313695 A CN 201710313695A CN 107194216 A CN107194216 A CN 107194216A
Authority
CN
China
Prior art keywords
data
quantile
point
gyroscope
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710313695.2A
Other languages
English (en)
Inventor
鲁鸣鸣
郭涵
郭一涵
郑林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201710313695.2A priority Critical patent/CN107194216A/zh
Publication of CN107194216A publication Critical patent/CN107194216A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/316User authentication by observing the pattern of computer usage, e.g. typical user behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Social Psychology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Collating Specific Patterns (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了一种基于用户划屏习惯的移动身份认证方法及***。本发明方法包括以下步骤:S1、对预处理后的数据的生物行为特征进行特征提取,将特征提取后的数据进行格式转换;S2、根据用户划屏操作模式选择随机森林分类器;S3、将格式转换后的数据提交给选定的随机森林分类器进行分类,对分类结果进行投票决定出最终的移动身份认证结果。本发明***与上述方法对应。本发明具有能轻松应对自由划屏操作模式下的身份认证需求,分类正确率高等特点。

Description

一种基于用户划屏习惯的移动身份认证方法及***
技术领域
本发明属于信息安全技术领域,尤其涉及一种基于用户划屏习惯的移动身份认证方法及***。
背景技术
目前智能手机上仍使用着传统的密码认证或图案模式匹配方式进行身份认证,然而这些认证方式在安全性上有着易截获、易破解、易泄露、易伪造以及与个人身份的弱相关等缺陷。不法分子利用移动终端上的木马和病毒程序就能轻易窃取用户的密码,并进而盗取用户隐私信息甚至银行账户。随着移动互联网和移动支付的广泛普及,迫切需要一种方便易用、安全性高,且与个人身份强相关的认证机制来应对现在越来越严峻的安全形势。
生物特征识别技术是一种基于生物统计学原理,利用人类个体之间固有的、独一无二的生理特征或行为习惯特征,结合高科技工具和手段来进行个人身份识别的一项技术。采用生物特征作为用户身份认证的媒介其优点在于:从安全性上来说有着难以伪造的特性,因为生物特征大部分都是独一无二的,非常难以伪造,更不会有泄露的风险。从易用性的角度来说,由于生物特征是固有的,用户不必随身携带或记忆,也不必手动输入,所以使用起来也非常便利,并且也无需担心丢失或遗忘等诸多问题。
由于移动智能手机装备了触摸屏和大量的传感器设备,这些设备使得在移动智能终端上能容易获得部分生物特征,即划屏习惯。因此在移动安全问题日益突出的新阶段,基于生物特征身份认证技术无疑是一种最佳的选择,可以预见该技术在能给移动安全认证、手机支付带来更高的安全性和便利性。
目前移动终端采用的身份认证方法主要有三种:
(1)基于密码匹配的移动身份认证
此方法即通过密码匹配来确认用户的身份,用户输入的密码与数据库里的密码一致则认为用户合法登录。这种认证方式在安全性上有着易截获、易破解、易泄露、易伪造以及与个人身份的弱相关等缺陷。
(2)基于图案匹配的移动身份认证
此方法即在屏幕上画某一图案来确认用户的身份,用户画出的图案形状与笔画顺序与数据库里的数据一致则认为用户合法登录。这种认证方式较传统的密码认证方式,在安全性上有了提高,但其仍有着可破解、易泄露、易伪造、与个人身份的弱相关等缺陷。
(3)基于生物特征识别的移动身份认证
该方法主要利用人类个体之间固有的、独一无二的生理或行为习惯特征,结合机器学习来进行个人身份识别。由于大部分手机不具备采集生理特征功能,目前在移动端的基于生物特征识别的研究主要集中于人类行为特征方面,该项技术尚处于研究阶段,目前并不成熟。
发明内容
本发明的目的在于提供一种基于用户划屏习惯的移动身份认证方法及***,旨在解决上述背景技术的不足。
本发明是这样实现的,一种基于用户划屏习惯的移动身份认证方法,该方法包括以下步骤:
S1、对预处理后的数据的生物行为特征进行特征提取,将特征提取后的数据进行格式转换;
S2、根据用户划屏操作模式选择随机森林分类器;
S3、将格式转换后的数据提交给选定的随机森林分类器进行分类,对分类结果进行投票决定出最终的移动身份认证结果。
优选地,在步骤S1中,所述数据为智能移动终端产生的触屏数据和传感器数据,包括X/Y轴坐标值、时间、屏幕压力和接触面积传感器数据、加速度传感器三轴数据、方向传感器三轴数据、陀螺仪的三轴数据;
在步骤S1中,所述数据的预处理包括:对不符合要求的数据进行过滤,对过滤后的数据进行统一度量转换,将像素数据转化为以毫米为单位的距离数据,以使得不同屏幕尺寸和分辨率的手机产生的数据能够统一规格;其中,所述不符合要求的数据包括采样点少于5像素的数据、非正常划屏的轨迹数据以及非法用户数据。
优选地,在步骤S1中,所述生物行为特征包括:方向传感器20%分位数、方向传感器50%分位数、方向传感器80%分位数、陀螺仪20%分位数、陀螺仪50%分位数、陀螺仪80%分位数、加速传感器20%分位数、加速传感器50%分位数、加速传感器80%分位数、方向传感器最大值、方向传感器最小值、方向传感器平均值、陀螺仪最大值、陀螺仪最小值、陀螺仪平均值、加速传感器最大值、加速传感器最小值、加速传感器平均值、始点方向传感器值、终点方向传感器值、始点陀螺仪值、终点陀螺仪值、始点加速传感器值、终点加速传感器、触屏始点坐标x、触屏始点坐标y、触屏终点坐标x、触屏终点坐标y、轨迹长度、端点连线长度与轨迹长度比值、手指接触面积中位数、始末点端到端距离、手指对屏幕压力中位数、划屏操作持续时间、最初5个点加速度中值、最后3个点速度的中值、点间加速度20%分位数、点间加速度50%分位数、点间加速度80%分位数、平均点间速度、点间速度20%分位数、点间速度50%分位数、点间速度80%分位数、端点连线到轨迹20%分位数、端点连线到轨迹50%分位数、端点连线到轨迹80%分位数、端连线到轨迹最大距离、平均点间速度、始末点连线与水平线夹角、两次划屏的间隔时间。
优选地,在步骤S2中,所述划屏操作模式包括由上往下、由下往上、由左往右、由右往左。
优选地,在步骤S2中,所述随机森林分类器具体为:通过bootstrap法从所述特征样本集中独立抽样K次,构建出K棵决策树,由K棵决策树构成随机森林分类器。
本发明进一步提供了一种基于用户划屏习惯的移动身份认证***,该***包括:
特征提取模块,用于对预处理后的数据的生物行为特征进行特征提取,将特征提取后的数据进行格式转换;
分类器选择模块,用于根据用户划屏操作模式选择随机森林分类器;
认证模块,用于将格式转换后的数据提交给选定的随机森林分类器进行分类,对分类结果进行投票决定出最终的移动身份认证结果。
优选地,在所述特征提取模块中,所述数据为智能移动终端产生的触屏数据和传感器数据,包括X/Y轴坐标值、时间、屏幕压力和接触面积传感器数据、加速度传感器三轴数据、方向传感器三轴数据、陀螺仪的三轴数据;
所述数据的预处理包括:对不符合要求的数据进行过滤,对过滤后的数据进行统一度量转换,将像素数据转化为以毫米为单位的距离数据,以使得不同屏幕尺寸和分辨率的手机产生的数据能够统一规格;其中,所述不符合要求的数据包括采样点少于5像素的数据、非正常划屏的轨迹数据以及非法用户数据。
优选地,所述生物行为特征包括:方向传感器20%分位数、方向传感器50%分位数、方向传感器80%分位数、陀螺仪20%分位数、陀螺仪50%分位数、陀螺仪80%分位数、加速传感器20%分位数、加速传感器50%分位数、加速传感器80%分位数、方向传感器最大值、方向传感器最小值、方向传感器平均值、陀螺仪最大值、陀螺仪最小值、陀螺仪平均值、加速传感器最大值、加速传感器最小值、加速传感器平均值、始点方向传感器值、终点方向传感器值、始点陀螺仪值、终点陀螺仪值、始点加速传感器值、终点加速传感器、触屏始点坐标x、触屏始点坐标y、触屏终点坐标x、触屏终点坐标y、轨迹长度、端点连线长度与轨迹长度比值、手指接触面积中位数、始末点端到端距离、手指对屏幕压力中位数、划屏操作持续时间、最初5个点加速度中值、最后3个点速度的中值、点间加速度20%分位数、点间加速度50%分位数、点间加速度80%分位数、平均点间速度、点间速度20%分位数、点间速度50%分位数、点间速度80%分位数、端点连线到轨迹20%分位数、端点连线到轨迹50%分位数、端点连线到轨迹80%分位数、端连线到轨迹最大距离、平均点间速度、始末点连线与水平线夹角、两次划屏的间隔时间。
优选地,在分类器选择模块中,所述划屏操作模式包括由上往下、由下往上、由左往右、由右往左。
优选地,在分类器选择模块中,所述随机森林分类器具体为:通过bootstrap法从所述特征样本集中独立抽样K次,构建出K棵决策树,由K棵决策树构成随机森林分类器。
本发明克服现有技术的不足,提供一种基于用户划屏习惯的移动身份认证方法及***。本发明的技术路线,如图1所示,包括:
(1)采集原始数据
通过安装手机上的应用采集用户使用手机时产生的触屏数据和传感器数据,并将数据发送至位于云端的服务器上。
(2)数据预处理
数据预处理阶段主要完成两个工作:第一、对不符合要求的数据进行过滤;第二、对部分数据进行转换统一度量。本发明中预处理部分工作在客户端完成,部分工作在服务端完成的。之所以这样设计是因为服务端的主要工作是响应大量客户端发过来的验证请求,把能在客户端完成的工作放在客户端可以减少服务端的压力,考虑到部分低端手机的性能问题,对一些涉及到复杂计算的预处理工作将其置于服务端来完成。
(3)特征处理
在对原始数据完成预处理工作后,就进入了特征处理阶段。该阶段需要完成的工作包括:1)特征提取,从多组原始数据中提取出本文提出的50种生物行为特征;数据持久化,将提取完特征后的数据存入数据库;2)数据转换,将提取完特征后的数据转换为分类器可以识别的数据。
本发明中采用的50种特征分别为:方向传感器20%分位数、方向传感器50%分位数、方向传感器80%分位数、陀螺仪20%分位数、陀螺仪50%分位数、陀螺仪80%分位数、加速传感器20%分位数、加速传感器50%分位数、加速传感器80%分位数、方向传感器最大值、方向传感器最小值、方向传感器平均值、陀螺仪最大值、陀螺仪最小值、陀螺仪平均值、加速传感器最大值、加速传感器最小值、加速传感器平均值、始点方向传感器值、终点方向传感器值、始点陀螺仪值、终点陀螺仪值、始点加速传感器值、终点加速传感器、触屏始点坐标x、触屏始点坐标y、触屏终点坐标x、触屏终点坐标y、轨迹长度、端点连线长度与轨迹长度比值、手指接触面积中位数、始末点端到端距离、手指对屏幕压力中位数、划屏操作持续时间、最初5个点加速度中值、最后3个点速度的中值、点间加速度20%分位数、点间加速度50%分位数、点间加速度80%分位数、平均点间速度、点间速度20%分位数、点间速度50%分位数、点间速度80%分位数、端点连线到轨迹20%分位数、端点连线到轨迹50%分位数、端点连线到轨迹80%分位数、端连线到轨迹最大距离、平均点间速度、始末点连线与水平线夹角、两次划屏的间隔时间。
(4)训练与分类处理
训练与分类处理是本发明的核心模块,包括模型选择、训练以及验证三个功能。特征向量传入此模块后先经过模型选择子模块,转发至相应模型下的训练与验证子模块,经验证模块后分类从而得到身份识别结果。
模型选择:本发明采用了一种多模判定的方法来保证自由划屏情况的识别正确率,本发明针对由上往下、由下往上、由左往右、由右往左4种操作模式,建立了4个身份识别模型,在进行训练与验证前进行身份识别模型选择。
训练阶段的目的是运用算法对注册用户的大量标准特征数据进行学习,本发明采用了随机森林算法构建身份识别模型,即利用随机的方法构建出多颗决策树组成决策树森林,从而得到一个身份识别模型。模型质量的好坏涉及身份识别的准确率,因此对于学习阶段所采用的学习数据要求非常高,该数据必须充分包含可以识别用户的特征,因此需要大量各种情景下的数据来建模,总的来说建模使用的数据越多模型的准确率越高。训练的过程就是随机森林的构建的过程,对于本发明来说,首先运用数据采集阶段采集的标准数据进行特征提取以生成特征样本集,然后通过bootstrap法(bootstrap是随机森林法中的一个步骤)独立抽样K次,并基于本发明使用的50组特征进行随机特征选取从而构建出K颗决策树,组成随机森林。
验证阶段的主要过程为,对新输入的不包含身份标记的某用户的特征数据,运用身份识别模型将用户的身份判别出来。对于本发明来说,首先将完成了特征提取后的数据,提交给身份识别模型——随机森林分类器进行分类,然后让这K颗随机决策树的分别进行分类,最后进行投票决定其最终的识别结果。
相比于现有技术的缺点和不足,本发明具有以下有益效果:与传统基于密码的认证方法相比,本发明采用生物行为特征(划屏习惯)来进行身份认证,从易用性来看,由于生物行为特征是每个人所固有的,因此用户不必随身携带或记忆密钥,从而也无需担心密钥丢失或遗忘等诸多问题;从安全性上来说由于划屏习惯特征具有难以伪造、无泄漏风险、且生物行为特征能真正反映用户本人的身份,对每个人来说其特有的生物特征都是独一无二的,因此,本发明具有难以破解、无泄露风险、不易伪造等优点。
附图说明
图1是本发明***框架流程图;
图2是本发明基于用户划屏习惯的移动身份认证方法的步骤流程图;
图3是本发明生成树构建范例对应的示意图;
图4是本发明基于用户划屏习惯的移动身份认证***的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图2所示,本发明公开了一种基于用户划屏习惯的移动身份认证方法,该方法包括以下步骤:
S1、对预处理后的数据的生物行为特征进行特征提取,将特征提取后的数据进行格式转换;
S2、根据用户划屏操作模式选择随机森林分类器;
S3、将格式转换后的数据提交给选定的随机森林分类器进行分类,对分类结果进行投票决定出最终的移动身份认证结果。
如步骤S1所述,所述数据为智能移动终端产生的触屏数据和传感器数据,包括X/Y轴坐标值、时间、屏幕压力和接触面积传感器数据、加速度传感器三轴数据、方向传感器三轴数据、陀螺仪的三轴数据;
在步骤S1中,所述数据的预处理包括:对不符合要求的数据进行过滤,对过滤后的数据进行统一度量转换,将像素数据转化为以毫米为单位的距离数据,以使得不同屏幕尺寸和分辨率的手机产生的数据能够统一规格;其中,所述不符合要求的数据包括采样点少于5像素的数据、非正常划屏的轨迹数据以及非法用户数据。
在步骤S1中,数据的预处理部分工作在客户端完成,部分工作在服务端完成的。之所以这样设计是因为服务端的主要工作是响应大量客户端发过来的验证请求,把能在客户端完成的工作放在客户端可以减少服务端的压力,考虑到部分低端手机的性能问题,对一些涉及到复杂计算的预处理工作将其置于服务端来完成。
在步骤S1中,所述生物行为特征包括:方向传感器20%分位数、方向传感器50%分位数、方向传感器80%分位数、陀螺仪20%分位数、陀螺仪50%分位数、陀螺仪80%分位数、加速传感器20%分位数、加速传感器50%分位数、加速传感器80%分位数、方向传感器最大值、方向传感器最小值、方向传感器平均值、陀螺仪最大值、陀螺仪最小值、陀螺仪平均值、加速传感器最大值、加速传感器最小值、加速传感器平均值、始点方向传感器值、终点方向传感器值、始点陀螺仪值、终点陀螺仪值、始点加速传感器值、终点加速传感器、触屏始点坐标x、触屏始点坐标y、触屏终点坐标x、触屏终点坐标y、轨迹长度、端点连线长度与轨迹长度比值、手指接触面积中位数、始末点端到端距离、手指对屏幕压力中位数、划屏操作持续时间、最初5个点加速度中值、最后3个点速度的中值、点间加速度20%分位数、点间加速度50%分位数、点间加速度80%分位数、平均点间速度、点间速度20%分位数、点间速度50%分位数、点间速度80%分位数、端点连线到轨迹20%分位数、端点连线到轨迹50%分位数、端点连线到轨迹80%分位数、端连线到轨迹最大距离、平均点间速度、始末点连线与水平线夹角、两次划屏的间隔时间。
生物行为特征的提取,如图3所示,图3中,R1、R2代表的是由这些特征组成的特征向量,x、y则是此时转化后的在屏幕上的x、y坐标,t为时间,p为百分位数。其中,当经过预处理后的原始数据到达特征处理模块后,通过对数据进行多组计算,得到由生物行为特征组成的一组特征向量,其中具体的描述如下表1所示:
表1 本发明生物行为特征及其缩写
在步骤S2中,针对由上往下、由下往上、由左往右、由右往左4种操作模式,建立了4个身份识别模型,在进行训练与验证前进行身份识别模型选择。
在步骤S2中,随机森林分类器的训练或构建过程具体为:通过bootstrap法从特征样本集中独立抽样K次,构建出K棵决策树,由K棵决策树构成随机森林分类器。
在本发明实施例中,随机森林分类器应当在先进行训练和构建,训练完善后的随机森林分类器用于移动身份认证。训练随机森林分类器所需要的特征样本为上述步骤S1中经过预处理、特征提取、格式转换后的样本,在此不再赘述。
训练阶段的目的是运用算法对注册用户的大量标准特征数据进行学习,本发明采用了随机森林算法构建身份识别模型(在本发明中,该身份识别模型也称为身份识别分类器、随机森林分类器),即利用随机的方法构建出多颗决策树组成决策树森林,从而得到一个身份识别模型。模型质量的好坏涉及身份识别的准确率,因此对于学习阶段所采用的学习数据要求非常高,该数据必须充分包含可以识别用户的特征,因此需要大量各种情景下的数据来建模,总的来说建模使用的数据越多模型的准确率越高。训练的过程就是随机森林的构建的过程,对于本发明来说,首先运用数据采集阶段采集的标准数据进行特征提取以生成特征样本集,然后通过bootstrap法独立抽样K次,并基于本发明使用的50组特征进行随机特征选取从而构建出K颗决策树,组成随机森林。
此外,本发明可以涉及一个增量训练模型,该训练模型用于指导身份识别分类器进行正确分类的重要的依据,训练过程目的是构造一个身份识别分类器,本发明中训练数据的来源分两部分,一部分来源于训练数据,另一部分来源于增量训练数据。其中训练数据属于训练阶段采集的数据。由于用户的习惯可能会随着时间的推移而出现微小的改变,因此本发明特的增量训练模型能有效的解决这种问题,增量训练的来源于验证阶段的数据。如果客户端传过来的验证数据,经身份认证模型识别为合法用户时,即将该组数据存入增量训练数据库,当该用户每天入库的数据量达到一定数量时则不再存入增量库。
身份识别分类器,是在训练模型的指导下工作的,对于每组未知身份的数据,经过身份识别分类器进行预测分类后从而得到一个分类结果,分类过程就此完成,然后将分类结果与特征向量中包含的身份标记对比,如果一致则返回用户合法,如果不一致则返回用户非法。
在步骤S3中,对新输入的不包含身份标记的某用户的特征数据,运用身份识别模型将用户的身份判别出来。
在步骤S3中,身份模型本身是一个判别器,生成之后输入直接就能有结果。
与传统基于密码的认证方法相比,采本发明用生物行为特征(划屏习惯)来进行身份认证,由于划屏习惯特征具有难以伪造、无泄漏风险、且生物行为特征能“真正”反映用户本人的身份,对每个人来说其特有的生物特征都是独一无二的,本发明有着无法破解、无泄露风险、不易伪造这些优点。因此,基本发明比传统的密码认证方法更具安全性,同时本发明还支持静默认证和持续性认证,即无需通过特定的认证操作进行认证,用户使用的手机的任何一种状态都可以作为认证过程。
为评估本方法的效果,本发明召集了31志愿者,让他们在5天时间中每天在手机上阅读一篇文档,并通过手机上的APP实时将触屏数据、传感器数据传送至服务端基于本发明的方法提取特征,整个实验过程中共收集到15万条原始数据,一组划屏数据由多条原始数据组成,通过特征提取最后得到了8024组划屏数据,另一组采样本发明方法,在该数据集中包含7656组由下往上划屏数据以及368组由上往下划屏数据,由于由下往上划屏样本量比较大,基于以上数据机器学习软件—Weka中进行效果评价,使用十折交叉验证法进行评估,该方法原理为将数据集划分成10等份,选取其中9份当作训练数据来构建身份识别分类器,余下的1份数据则作为测试数据来进行验证实验。划分与验证将共进行10次,然后对这10次测试得到的各种评价指标的数值,求均值从而得到最后的评价结果。
实验表明本发明数据集上达到了97.49%的正确率,详细指标如下表2所示:
表2 本发明性能指标
同时,与其他相似的方案(Feng等[1]、Zheng等[2]、Meng等[3]、Frank等[4])相比,本发明结果更为优秀,比较结果如下表3所示:
表3 相似技术方案与本发明的比较
由表3可以看出,相比于Zheng等的基于传感器的身份认证方案,Frank等的基于触屏的身份认证方法等,本发明,即基于传感器与触屏的融合方案,识别效果远高于这四种方案。
如图4所示,本发明进一步提供了一种基于用户划屏习惯的移动身份认证***,该***包括:
特征提取模块1,用于对预处理后的数据的生物行为特征进行特征提取,将特征提取后的数据进行格式转换;
分类器选择模块2,用于根据用户划屏操作模式选择随机森林分类器;
认证模块3,用于将格式转换后的数据提交给选定的随机森林分类器进行分类,对分类结果进行投票决定出最终的移动身份认证结果。
如特征提取模块1所述,所述数据为智能移动终端产生的触屏数据和传感器数据,包括X/Y轴坐标值、时间、屏幕压力和接触面积传感器数据、加速度传感器三轴数据、方向传感器三轴数据、陀螺仪的三轴数据;
在特征提取模块1中,所述数据的预处理包括:对不符合要求的数据进行过滤,对过滤后的数据进行统一度量转换,将像素数据转化为以毫米为单位的距离数据,以使得不同屏幕尺寸和分辨率的手机产生的数据能够统一规格;其中,所述不符合要求的数据包括采样点少于5像素的数据、非正常划屏的轨迹数据以及非法用户数据。
在特征提取模块1中,数据的预处理部分工作在客户端完成,部分工作在服务端完成的。之所以这样设计是因为服务端的主要工作是响应大量客户端发过来的验证请求,把能在客户端完成的工作放在客户端可以减少服务端的压力,考虑到部分低端手机的性能问题,对一些涉及到复杂计算的预处理工作将其置于服务端来完成。
在特征提取模块1中,所述生物行为特征包括:方向传感器20%分位数、方向传感器50%分位数、方向传感器80%分位数、陀螺仪20%分位数、陀螺仪50%分位数、陀螺仪80%分位数、加速传感器20%分位数、加速传感器50%分位数、加速传感器80%分位数、方向传感器最大值、方向传感器最小值、方向传感器平均值、陀螺仪最大值、陀螺仪最小值、陀螺仪平均值、加速传感器最大值、加速传感器最小值、加速传感器平均值、始点方向传感器值、终点方向传感器值、始点陀螺仪值、终点陀螺仪值、始点加速传感器值、终点加速传感器、触屏始点坐标x、触屏始点坐标y、触屏终点坐标x、触屏终点坐标y、轨迹长度、端点连线长度与轨迹长度比值、手指接触面积中位数、始末点端到端距离、手指对屏幕压力中位数、划屏操作持续时间、最初5个点加速度中值、最后3个点速度的中值、点间加速度20%分位数、点间加速度50%分位数、点间加速度80%分位数、平均点间速度、点间速度20%分位数、点间速度50%分位数、点间速度80%分位数、端点连线到轨迹20%分位数、端点连线到轨迹50%分位数、端点连线到轨迹80%分位数、端连线到轨迹最大距离、平均点间速度、始末点连线与水平线夹角、两次划屏的间隔时间。
生物行为特征的提取,如图3所示,图3中,R1、R2代表的是由这些特征组成的特征向量,x、y则是此时转化后的在屏幕上的x、y坐标,t为时间,p为百分位数。其中,当经过预处理后的原始数据到达特征处理模块后,通过对数据进行多组计算,得到由生物行为特征组成的一组特征向量,其中具体的描述如下表1所示:
表1 本发明生物行为特征及其缩写
在分类器选择模块2中,针对由上往下、由下往上、由左往右、由右往左4种操作模式,建立了4个身份识别模型,在进行训练与验证前进行身份识别模型选择。
在分类器选择模块2中,随机森林分类器的训练或构建过程具体为:通过bootstrap法从特征样本集中独立抽样K次,构建出K棵决策树,由K棵决策树构成随机森林分类器。
在本发明实施例中,随机森林分类器应当在先进行训练和构建,训练完善后的随机森林分类器用于移动身份认证。训练随机森林分类器所需要的特征样本为上述特征提取模块1中经过预处理、特征提取、格式转换后的样本,在此不再赘述。
训练阶段的目的是运用算法对注册用户的大量标准特征数据进行学习,本发明采用了随机森林算法构建身份识别模型(在本发明中,该身份识别模型也称为身份识别分类器、随机森林分类器),即利用随机的方法构建出多颗决策树组成决策树森林,从而得到一个身份识别模型。模型质量的好坏涉及身份识别的准确率,因此对于学习阶段所采用的学习数据要求非常高,该数据必须充分包含可以识别用户的特征,因此需要大量各种情景下的数据来建模,总的来说建模使用的数据越多模型的准确率越高。训练的过程就是随机森林的构建的过程,对于本发明来说,首先运用数据采集阶段采集的标准数据进行特征提取以生成特征样本集,然后通过bootstrap法独立抽样K次,并基于本发明使用的50组特征进行随机特征选取从而构建出K颗决策树,组成随机森林。
此外,本发明可以涉及一个增量训练模型,该训练模型用于指导身份识别分类器进行正确分类的重要的依据,训练过程目的是构造一个身份识别分类器,本发明中训练数据的来源分两部分,一部分来源于训练数据,另一部分来源于增量训练数据。其中训练数据属于训练阶段采集的数据。由于用户的习惯可能会随着时间的推移而出现微小的改变,因此本发明特的增量训练模型能有效的解决这种问题,增量训练的来源于验证阶段的数据。如果客户端传过来的验证数据,经身份认证模型识别为合法用户时,即将该组数据存入增量训练数据库,当该用户每天入库的数据量达到一定数量时则不再存入增量库。
身份识别分类器,是在训练模型的指导下工作的,对于每组未知身份的数据,经过身份识别分类器进行预测分类后从而得到一个分类结果,分类过程就此完成,然后将分类结果与特征向量中包含的身份标记对比,如果一致则返回用户合法,如果不一致则返回用户非法。
在认证模块3中,对新输入的不包含身份标记的某用户的特征数据,运用身份识别模型将用户的身份判别出来。
在认证模块3中,身份模型本身是一个判别器,生成之后输入直接就能有结果。
与传统基于密码的认证***相比,采本发明用生物行为特征(划屏习惯)来进行身份认证,由于划屏习惯特征具有难以伪造、无泄漏风险、且生物行为特征能“真正”反映用户本人的身份,对每个人来说其特有的生物特征都是独一无二的,本发明有着无法破解、无泄露风险、不易伪造这些优点。因此,基本发明比传统的密码认证***更具安全性,同时本发明还支持静默认证和持续性认证,即无需通过特定的认证操作进行认证,用户使用的手机的任何一种状态都可以作为认证过程。
为评估本***的效果,本发明召集了31志愿者,让他们在5天时间中每天在手机上阅读一篇文档,并通过手机上的APP实时将触屏数据、传感器数据传送至服务端基于本发明***提取特征,整个实验过程中共收集到15万条原始数据,一组划屏数据由多条原始数据组成,通过特征提取最后得到了8024组划屏数据,另一组采样本发明***,在该数据集中包含7656组由下往上划屏数据以及368组由上往下划屏数据,由于由下往上划屏样本量比较大,基于以上数据机器学习软件—Weka中进行效果评价,使用十折交叉验证法进行评估,该***原理为将数据集划分成10等份,选取其中9份当作训练数据来构建身份识别分类器,余下的1份数据则作为测试数据来进行验证实验。划分与验证将共进行10次,然后对这10次测试得到的各种评价指标的数值,求均值从而得到最后的评价结果。
实验表明本发明数据集上达到了97.49%的正确率,详细指标如下表2所示:
表2 本发明性能指标
同时,与其他相似的方案(Feng等[1]、Zheng等[2]、Meng等[3]、Frank等[4])相比,本发明结果更为优秀,比较结果如下表3所示:
表3 相似技术方案与本发明的比较
由表3可以看出,相比于Zheng等的基于传感器的身份认证方案,Frank等的基于触屏的身份认证方法等,本发明,即基于传感器与触屏的融合方案,识别效果远高于这四种方案。
参考文献:
[1]Feng T,Liu Z,Kwon K A,et al.Continuous mobile authentication usingtouchscreen gestures[C].IEEE Conference on Technologies forHomeland Security(HST),2012:451-456.
[2]Zheng N,Bai K,Huang H,et al.You are how you touch:Userverification on smartphones viatappingbehaviors[R].Tech.Rep.WM-CS-2012-06,2012.
[3]Meng Y,Wong D S,Schlegel R.Touch Gestures Based BiometricAuthentication Scheme for Touchscreen Mobile Phones[C].Information Securityand Cryptology.Springer Berlin Heidelberg,2013:331-350.
[4]Frank M,Biedert R,Ma E,et al.Touchalytics:On the applicabilityoftouchscreen input as a behavioral biometric for continuous authentication[J].IEEE Transactions on Information Forensics and Security,2013,8(1):136-148.
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于用户划屏习惯的移动身份认证方法,其特征在于,该方法包括以下步骤:
S1、对预处理后的数据的生物行为特征进行特征提取,将特征提取后的数据进行格式转换;
S2、根据用户划屏操作模式选择随机森林分类器;
S3、将格式转换后的数据提交给选定的随机森林分类器进行分类,对分类结果进行投票决定出最终的移动身份认证结果。
2.如权利要求1所述的基于用户划屏习惯的移动身份认证方法,其特征在于,在步骤S1中,所述数据为智能移动终端产生的触屏数据和传感器数据,包括X/Y轴坐标值、时间、屏幕压力和接触面积传感器数据、加速度传感器三轴数据、方向传感器三轴数据、陀螺仪的三轴数据;
在步骤S1中,所述数据的预处理包括:对不符合要求的数据进行过滤,对过滤后的数据进行统一度量转换,将像素数据转化为以毫米为单位的距离数据,以使得不同屏幕尺寸和分辨率的手机产生的数据能够统一规格;其中,所述不符合要求的数据包括采样点少于5像素的数据、非正常划屏的轨迹数据以及非法用户数据。
3.如权利要求2所述的基于用户划屏***均值、陀螺仪最大值、陀螺仪最小值、陀螺仪平均值、加速传感器最大值、加速传感器最小值、加速传感器平均值、始点方向传感器值、终点方向传感器值、始点陀螺仪值、终点陀螺仪值、始点加速传感器值、终点加速传感器、触屏始点坐标x、触屏始点坐标y、触屏终点坐标x、触屏终点坐标y、轨迹长度、端点连线长度与轨迹长度比值、手指接触面积中位数、始末点端到端距离、手指对屏幕压力中位数、划屏操作持续时间、最初5个点加速度中值、最后3个点速度的中值、点间加速度20%分位数、点间加速度50%分位数、点间加速度80%分位数、平均点间速度、点间速度20%分位数、点间速度50%分位数、点间速度80%分位数、端点连线到轨迹20%分位数、端点连线到轨迹50%分位数、端点连线到轨迹80%分位数、端连线到轨迹最大距离、平均点间速度、始末点连线与水平线夹角、两次划屏的间隔时间。
4.如权利要求1所述的基于用户划屏习惯的移动身份认证方法,其特征在于,在步骤S2中,所述划屏操作模式包括由上往下、由下往上、由左往右、由右往左。
5.如权利要求4所述的基于用户划屏习惯的移动身份认证方法,其特征在于,在步骤S2中,所述随机森林分类器具体为:通过bootstrap法从所述特征样本集中独立抽样K次,构建出K棵决策树,由K棵决策树构成随机森林分类器。
6.一种基于用户划屏习惯的移动身份认证***,其特征在于,该***包括:
特征提取模块,用于对预处理后的数据的生物行为特征进行特征提取,将特征提取后的数据进行格式转换;
分类器选择模块,用于根据用户划屏操作模式选择随机森林分类器;
认证模块,用于将格式转换后的数据提交给选定的随机森林分类器进行分类,对分类结果进行投票决定出最终的移动身份认证结果。
7.如权利要求6所述的基于用户划屏习惯的移动身份认证***,其特征在于,在所述特征提取模块中,所述数据为智能移动终端产生的触屏数据和传感器数据,包括X/Y轴坐标值、时间、屏幕压力和接触面积传感器数据、加速度传感器三轴数据、方向传感器三轴数据、陀螺仪的三轴数据;
所述数据的预处理包括:对不符合要求的数据进行过滤,对过滤后的数据进行统一度量转换,将像素数据转化为以毫米为单位的距离数据,以使得不同屏幕尺寸和分辨率的手机产生的数据能够统一规格;其中,所述不符合要求的数据包括采样点少于5像素的数据、非正常划屏的轨迹数据以及非法用户数据。
8.如权利要求7所述的基于用户划屏***均值、陀螺仪最大值、陀螺仪最小值、陀螺仪平均值、加速传感器最大值、加速传感器最小值、加速传感器平均值、始点方向传感器值、终点方向传感器值、始点陀螺仪值、终点陀螺仪值、始点加速传感器值、终点加速传感器、触屏始点坐标x、触屏始点坐标y、触屏终点坐标x、触屏终点坐标y、轨迹长度、端点连线长度与轨迹长度比值、手指接触面积中位数、始末点端到端距离、手指对屏幕压力中位数、划屏操作持续时间、最初5个点加速度中值、最后3个点速度的中值、点间加速度20%分位数、点间加速度50%分位数、点间加速度80%分位数、平均点间速度、点间速度20%分位数、点间速度50%分位数、点间速度80%分位数、端点连线到轨迹20%分位数、端点连线到轨迹50%分位数、端点连线到轨迹80%分位数、端连线到轨迹最大距离、平均点间速度、始末点连线与水平线夹角、两次划屏的间隔时间。
9.如权利要求6所述的基于用户划屏习惯的移动身份认证***,其特征在于,在分类器选择模块中,所述划屏操作模式包括由上往下、由下往上、由左往右、由右往左。
10.如权利要求9所述的基于用户划屏习惯的移动身份认证***,其特征在于,在分类器选择模块中,所述随机森林分类器具体为:通过bootstrap法从所述特征样本集中独立抽样K次,构建出K棵决策树,由K棵决策树构成随机森林分类器。
CN201710313695.2A 2017-05-05 2017-05-05 一种基于用户划屏习惯的移动身份认证方法及*** Pending CN107194216A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710313695.2A CN107194216A (zh) 2017-05-05 2017-05-05 一种基于用户划屏习惯的移动身份认证方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710313695.2A CN107194216A (zh) 2017-05-05 2017-05-05 一种基于用户划屏习惯的移动身份认证方法及***

Publications (1)

Publication Number Publication Date
CN107194216A true CN107194216A (zh) 2017-09-22

Family

ID=59874010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710313695.2A Pending CN107194216A (zh) 2017-05-05 2017-05-05 一种基于用户划屏习惯的移动身份认证方法及***

Country Status (1)

Country Link
CN (1) CN107194216A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106470192A (zh) * 2015-08-19 2017-03-01 阿里巴巴集团控股有限公司 身份验证方法、装置及***
CN109068009A (zh) * 2018-10-26 2018-12-21 北京交通大学 基于上下文检测的智能手机隐式身份认证方法
CN109145778A (zh) * 2018-08-01 2019-01-04 上海市数字证书认证中心有限公司 身份认证方法、装置及识别终端
CN109961165A (zh) * 2017-12-25 2019-07-02 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN110418337A (zh) * 2019-07-29 2019-11-05 北京邮电大学 身份认证方法及装置
CN110472389A (zh) * 2019-07-31 2019-11-19 南京大学 基于触控手势的身份认证***及其工作方法
CN110866231A (zh) * 2019-10-14 2020-03-06 北京邮电大学 服务器、智能终端以及隐式身份认证***和方法
CN111159698A (zh) * 2019-12-31 2020-05-15 北京交通大学 基于九宫格密码的终端隐式身份认证方法
CN111273131A (zh) * 2020-03-17 2020-06-12 辽宁工程技术大学 基于能量特性与随机森林的光伏并网发电孤岛检测方法
CN112035775A (zh) * 2020-09-01 2020-12-04 中国平安财产保险股份有限公司 基于随机森林模型的用户识别方法、装置和计算机设备
CN112492090A (zh) * 2020-11-27 2021-03-12 南京航空航天大学 智能手机上融合滑动轨迹和动力学特征的持续身份认证方法
CN112487374A (zh) * 2020-12-04 2021-03-12 重庆邮电大学 基于触摸屏交互行为的自适应持续身份认证方法及***
CN114021181A (zh) * 2021-10-13 2022-02-08 哈尔滨工业大学 基于使用习惯的移动智能终端隐私持续保护***及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530540A (zh) * 2013-09-27 2014-01-22 西安交通大学 基于人机交互行为特征的用户身份属性检测方法
CN103530546A (zh) * 2013-10-25 2014-01-22 东北大学 一种基于用户鼠标行为的身份认证方法
CN103927467A (zh) * 2014-04-25 2014-07-16 武汉大学 一种基于触屏行为的智能手机认证***及方法
CN104239761A (zh) * 2014-09-15 2014-12-24 西安交通大学 基于触屏滑动行为特征的身份持续认证方法
CN104408341A (zh) * 2014-11-13 2015-03-11 西安交通大学 基于陀螺仪行为特征的智能手机用户身份认证方法
CN105678125A (zh) * 2014-11-20 2016-06-15 阿里巴巴集团控股有限公司 一种用户认证方法、装置
EP3054279A1 (en) * 2015-02-06 2016-08-10 St. Anna Kinderkrebsforschung e.V. Methods for classification and visualization of cellular populations on a single cell level based on microscopy images
US20170124152A1 (en) * 2015-11-02 2017-05-04 LeapYear Technologies, Inc. Differentially private processing and database storage

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530540A (zh) * 2013-09-27 2014-01-22 西安交通大学 基于人机交互行为特征的用户身份属性检测方法
CN103530546A (zh) * 2013-10-25 2014-01-22 东北大学 一种基于用户鼠标行为的身份认证方法
CN103927467A (zh) * 2014-04-25 2014-07-16 武汉大学 一种基于触屏行为的智能手机认证***及方法
CN104239761A (zh) * 2014-09-15 2014-12-24 西安交通大学 基于触屏滑动行为特征的身份持续认证方法
CN104408341A (zh) * 2014-11-13 2015-03-11 西安交通大学 基于陀螺仪行为特征的智能手机用户身份认证方法
CN105678125A (zh) * 2014-11-20 2016-06-15 阿里巴巴集团控股有限公司 一种用户认证方法、装置
EP3054279A1 (en) * 2015-02-06 2016-08-10 St. Anna Kinderkrebsforschung e.V. Methods for classification and visualization of cellular populations on a single cell level based on microscopy images
US20170124152A1 (en) * 2015-11-02 2017-05-04 LeapYear Technologies, Inc. Differentially private processing and database storage

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106470192A (zh) * 2015-08-19 2017-03-01 阿里巴巴集团控股有限公司 身份验证方法、装置及***
CN109961165B (zh) * 2017-12-25 2023-11-28 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN109961165A (zh) * 2017-12-25 2019-07-02 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN109145778A (zh) * 2018-08-01 2019-01-04 上海市数字证书认证中心有限公司 身份认证方法、装置及识别终端
CN109068009A (zh) * 2018-10-26 2018-12-21 北京交通大学 基于上下文检测的智能手机隐式身份认证方法
CN110418337A (zh) * 2019-07-29 2019-11-05 北京邮电大学 身份认证方法及装置
CN110472389A (zh) * 2019-07-31 2019-11-19 南京大学 基于触控手势的身份认证***及其工作方法
CN110866231A (zh) * 2019-10-14 2020-03-06 北京邮电大学 服务器、智能终端以及隐式身份认证***和方法
CN111159698A (zh) * 2019-12-31 2020-05-15 北京交通大学 基于九宫格密码的终端隐式身份认证方法
CN111273131A (zh) * 2020-03-17 2020-06-12 辽宁工程技术大学 基于能量特性与随机森林的光伏并网发电孤岛检测方法
CN112035775A (zh) * 2020-09-01 2020-12-04 中国平安财产保险股份有限公司 基于随机森林模型的用户识别方法、装置和计算机设备
CN112035775B (zh) * 2020-09-01 2023-11-14 中国平安财产保险股份有限公司 基于随机森林模型的用户识别方法、装置和计算机设备
CN112492090A (zh) * 2020-11-27 2021-03-12 南京航空航天大学 智能手机上融合滑动轨迹和动力学特征的持续身份认证方法
CN112487374A (zh) * 2020-12-04 2021-03-12 重庆邮电大学 基于触摸屏交互行为的自适应持续身份认证方法及***
CN114021181A (zh) * 2021-10-13 2022-02-08 哈尔滨工业大学 基于使用习惯的移动智能终端隐私持续保护***及方法

Similar Documents

Publication Publication Date Title
CN107194216A (zh) 一种基于用户划屏习惯的移动身份认证方法及***
Tolosana et al. DeepSign: Deep on-line signature verification
CN108229130B (zh) 一种验证方法及装置
Holz et al. Bodyprint: Biometric user identification on mobile devices using the capacitive touchscreen to scan body parts
US6810480B1 (en) Verification of identity and continued presence of computer users
Blanco‐Gonzalo et al. Performance evaluation of handwritten signature recognition in mobile environments
CN103258157B (zh) 一种基于手指信息的在线笔迹认证方法及***
CN108197445A (zh) 计算机用户身份识别装置及使用方法
EP3455766A1 (en) Authenticating a user
Gomez-Barrero et al. Enhanced on-line signature verification based on skilled forgery detection using sigma-lognormal features
CN104537290A (zh) 基于多重指纹识别的密码***及其实现方法
US11436316B2 (en) Authentication system, authentication device, authentication method, and program
CN106709417A (zh) 一种多模态生物识别***及其使用方法
CN103595538A (zh) 基于手机加速度传感器的身份认证方法
CN113656761B (zh) 基于生物识别技术的业务处理方法、装置和计算机设备
EP4088205B1 (en) System and method for disentangling features specific to users, actions and devices recorded in motion sensor data
CN106572097A (zh) 一种基于移动设备的混合式身份认证方法
CN103235957A (zh) 一种基于手掌侧表面信息的在线笔迹认证方法及***
CN111625792A (zh) 一种基于异常行为检测的身份识别方法
Tolosana et al. Do you need more data? the DeepSignDB on-line handwritten signature biometric database
Stragapede et al. IJCB 2022 mobile behavioral biometrics competition (MobileB2C)
WO2010028517A1 (zh) 通过类神经网络生成/验证密码的方法及***
CN104202464A (zh) 基于电容感应的手机解锁***
CN101789114A (zh) 网络问卷调查中的数据源防伪方法
CN107615299A (zh) 用于评估指纹模板的方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170922