CN108470116A - 一种计算机***及其用户的身份识别方法和装置 - Google Patents
一种计算机***及其用户的身份识别方法和装置 Download PDFInfo
- Publication number
- CN108470116A CN108470116A CN201810193736.3A CN201810193736A CN108470116A CN 108470116 A CN108470116 A CN 108470116A CN 201810193736 A CN201810193736 A CN 201810193736A CN 108470116 A CN108470116 A CN 108470116A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- computer
- personal identification
- canonical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种计算机***及其用户的身份识别方法和装置,计算机身份识别步骤包括:步骤一:计算机的训练过程;步骤二:对个人身份的测试过程;训练过程包括:正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习四部分组成;训练过程包括:文本预处理、权重计算与特征词降维和个人身份信息识别模型。该一种计算机***及其用户的身份识别方法和装置,通过采用正则信息表达式的信息匹配来进行个人身份信息的筛选,一方面简单易用,另一方面则能表现出正则信息表达式的信息匹配的匹配速度和效率,进而能够提高对用户的身份的识别能力。
Description
技术领域
本发明涉及计算机识别身份设备技术领域,具体为一种计算机***及其用户的身份识别方法和装置。
背景技术
身份识别是指***的用户在进入***或访问不同保护级别的***资源时,***确认该用户的身份是否真实、合法和唯一。身份识别是识别和证实主体身份的过程。它往往是许多应用***中安全保护的第道防线,也是保证应用***安全的关键。识别认证方案主要用于实现以下目的:识别认证用户的身份,防止非法用户假合法用户身份占用***资源、删除或窜改用户存储的数据,降低对用户的识别速度。
发明内容
本发明的目的在于提供一种计算机***及其用户的身份识别方法和装置,以解决现有的技术缺陷和不能达到的技术要求。
为实现上述目的,本发明提供如下技术方案:一种计算机***及其用户的身份识别方法和装置,计算机身份识别步骤包括:步骤一:计算机的训练过程;步骤二:对个人身份的测试过程;训练过程包括:正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习四部分组成;训练过程包括:文本预处理、权重计算与特征词降维和个人身份信息识别模型。
优选的,所述电子邮件同时进行训练过程和测试过程,电子邮件信号经过正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习,最后信号传递给个人身份信息识别模型,进而判断出用户的身份信息。
优选的,所述正则信息表达式的信息匹配通过提取输入的协议密码,撰写相对应的正则表达式;正则表达式能够检查串中含有字串,对字串进行替换或者取出;用户通过编写基于正则信息表达式的信息匹配***,然后将匹配到的数据与计算机内的结果对应,计算机执行相应的操作将数据替换成文本信息。
优选的,所述权重计算与特征词降维对正则表达式匹配出来的电子邮件的文本文档进行一定的预处理;对文档库进行降维处理,将特征维数压缩到与训练样本个数相适应的程度,因此提高鉴别信息的类别数量。
优选的,所述预先分好类的样本构成训练集,为每个类别作出准确的描述,计算机对数据库中的数据进行分类,提高计算机的学习能力和泛化性能,计算机通过个人身份信息识别模型对用户进行判断,从而确定用户的身份信息。
与现有技术相比,本发明的有益效果如下:
采用正则信息表达式的信息匹配来进行个人身份信息的筛选,一方面简单易用,另一方面则能表现出正则信息表达式的信息匹配的匹配速度和效率,进而能够提高对用户的身份的识别能力。
附图说明
图1为本发明一种计算机***及其用户的身份识别方法和装置结构示意图。
具体实施方式
下面将结合本发明,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种技术方案:一种计算机***及其用户的身份识别方法和装置,计算机身份识别步骤包括:步骤一:计算机的训练过程;步骤二:对个人身份的测试过程;训练过程包括:正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习四部分组成;训练过程包括:文本预处理、权重计算与特征词降维和个人身份信息识别模型。
电子邮件同时进行训练过程和测试过程,电子邮件信号经过正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习,最后信号传递给个人身份信息识别模型,进而判断出用户的身份信息。
正则信息表达式的信息匹配通过提取输入的协议密码,撰写相对应的正则表达式;正则表达式能够检查串中含有字串,对字串进行替换或者取出;用户通过编写基于正则信息表达式的信息匹配***,然后将匹配到的数据与计算机内的结果对应,计算机执行相应的操作将数据替换成文本信息。
权重计算与特征词降维对正则表达式匹配出来的电子邮件的文本文档进行一定的预处理;对文档库进行降维处理,将特征维数压缩到与训练样本个数相适应的程度,因此提高鉴别信息的类别数量。
预先分好类的样本构成训练集,为每个类别作出准确的描述,计算机对数据库中的数据进行分类,提高计算机的学习能力和泛化性能,计算机通过个人身份信息识别模型对用户进行判断,从而确定用户的身份信息。
本发明一种计算机***及其用户的身份识别方法和装置,基于正则表达式的信息匹配主要是便于快速地从电子邮件中匹配出包含有个人身份信息的电子邮件的模块;文本预处理则是将非结构化的基于人类自然语言的文本转换为机器可识别的文本;权重计算和特征降维是对分出来的词进行一定的处理,以便进行机器学习;机器学习则是对特征向量进行训练,最终形成个人身份信息识别模型;个人身份信息识别模型对用户进行识别,从而判断用户的身份信息。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (5)
1.一种计算机***及其用户的身份识别方法和装置,其特征在于:计算机身份识别步骤包括:步骤一:计算机的训练过程;步骤二:对个人身份的测试过程;训练过程包括:正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习四部分组成;训练过程包括:文本预处理、权重计算与特征词降维和个人身份信息识别模型。
2.根据权利要求1所述的一种计算机***及其用户的身份识别方法和装置,其特征在于:电子邮件同时进行训练过程和测试过程,电子邮件信号经过正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习,最后信号传递给个人身份信息识别模型,进而判断出用户的身份信息。
3.根据权利要求1所述的一种计算机***及其用户的身份识别方法和装置,其特征在于:正则信息表达式的信息匹配通过提取输入的协议密码,撰写相对应的正则表达式;正则表达式能够检查串中含有字串,对字串进行替换或者取出;用户通过编写基于正则信息表达式的信息匹配***,然后将匹配到的数据与计算机内的结果对应,计算机执行相应的操作将数据替换成文本信息。
4.根据权利要求1所述的一种计算机***及其用户的身份识别方法和装置,其特征在于:权重计算与特征词降维对正则表达式匹配出来的电子邮件的文本文档进行一定的预处理;对文档库进行降维处理,将特征维数压缩到与训练样本个数相适应的程度,因此提高鉴别信息的类别数量。
5.根据权利要求1所述的一种计算机***及其用户的身份识别方法和装置,其特征在于:预先分好类的样本构成训练集,为每个类别作出准确的描述,计算机对数据库中的数据进行分类,提高计算机的学习能力和泛化性能,计算机通过个人身份信息识别模型对用户进行判断,从而确定用户的身份信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810193736.3A CN108470116A (zh) | 2018-03-03 | 2018-03-03 | 一种计算机***及其用户的身份识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810193736.3A CN108470116A (zh) | 2018-03-03 | 2018-03-03 | 一种计算机***及其用户的身份识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108470116A true CN108470116A (zh) | 2018-08-31 |
Family
ID=63265176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810193736.3A Pending CN108470116A (zh) | 2018-03-03 | 2018-03-03 | 一种计算机***及其用户的身份识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108470116A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102033964A (zh) * | 2011-01-13 | 2011-04-27 | 北京邮电大学 | 基于块划分及位置权重的文本分类方法 |
CN103914990A (zh) * | 2013-01-07 | 2014-07-09 | 福特全球技术公司 | 用于动态嵌入对象处理的方法和设备 |
CN106446230A (zh) * | 2016-10-08 | 2017-02-22 | 国云科技股份有限公司 | 一种优化机器学习文本中词语分类的方法 |
CN106651490A (zh) * | 2016-07-13 | 2017-05-10 | 甘肃徽商商城电子商务有限公司 | 移动电子商务平台及其方法 |
-
2018
- 2018-03-03 CN CN201810193736.3A patent/CN108470116A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102033964A (zh) * | 2011-01-13 | 2011-04-27 | 北京邮电大学 | 基于块划分及位置权重的文本分类方法 |
CN103914990A (zh) * | 2013-01-07 | 2014-07-09 | 福特全球技术公司 | 用于动态嵌入对象处理的方法和设备 |
CN106651490A (zh) * | 2016-07-13 | 2017-05-10 | 甘肃徽商商城电子商务有限公司 | 移动电子商务平台及其方法 |
CN106446230A (zh) * | 2016-10-08 | 2017-02-22 | 国云科技股份有限公司 | 一种优化机器学习文本中词语分类的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230013306A1 (en) | Sensitive Data Classification | |
Iqbal et al. | E-mail authorship verification for forensic investigation | |
Narayanan et al. | On the feasibility of internet-scale author identification | |
CN105991593B (zh) | 一种识别用户风险的方法及装置 | |
Shahid et al. | Detecting and mitigating the dissemination of fake news: Challenges and future research opportunities | |
CN113726784B (zh) | 一种网络数据的安全监控方法、装置、设备及存储介质 | |
CN112860841A (zh) | 一种文本情感分析方法、装置、设备及存储介质 | |
Neal et al. | Exploiting linguistic style as a cognitive biometric for continuous verification | |
Erbilek et al. | Framework for managing ageing effects in signature biometrics | |
Monaco et al. | Recent advances in the development of a long-text-input keystroke biometric authentication system for arbitrary text input | |
Pariyani et al. | Hate speech detection in twitter using natural language processing | |
US10521580B1 (en) | Open data biometric identity validation | |
CN112468659A (zh) | 应用于电话客服的质量评价方法、装置、设备及存储介质 | |
CN110263539A (zh) | 一种基于并行集成学习的安卓恶意应用检测方法及*** | |
Saunders et al. | Using automated comparisons to quantify handwriting individuality | |
CN114398681A (zh) | 训练隐私信息分类模型、识别隐私信息的方法和装置 | |
CN112016317A (zh) | 基于人工智能的敏感词识别方法、装置及计算机设备 | |
CN115394318A (zh) | 一种音频检测方法和装置 | |
Sadman et al. | Stylometry as a reliable method for fallback authentication | |
CN112562736A (zh) | 一种语音数据集质量评估方法和装置 | |
CN108470116A (zh) | 一种计算机***及其用户的身份识别方法和装置 | |
CN110955796A (zh) | 一种基于笔录信息的案件特征信息提取方法及装置 | |
Stolerman et al. | Active linguistic authentication revisited: Real-time stylometric evaluation towards multi-modal decision fusion | |
Baynath et al. | Improving Security Of Keystroke Dynamics By Increasing The Distance Between Keys | |
CN110610213A (zh) | 一种邮件分类方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180831 |