CN117993879A

CN117993879A - 一种基于机器学习模型对考勤异常的预测及处理方法

Info

Publication number: CN117993879A
Application number: CN202410070162.6A
Authority: CN
Inventors: 刘庆婷
Original assignee: Suzhou Gaiya Information Technology Co ltd
Current assignee: Suzhou Gaiya Information Technology Co ltd
Priority date: 2024-01-17
Filing date: 2024-01-17
Publication date: 2024-05-07

Abstract

本申请涉及一种基于机器学习模型对考勤异常的预测及处理方法，其属于考勤技术领域，包括：获取指定历史时期的考勤数据，对考勤数据进行预处理得到考勤结果；根据考勤结果，以及预设的特征集，获取与特征集内的每一特征相对应的第一特征数据；将第一特征数据输入预构建的预测模型，对预测模型进行训练，以使得预测模型输出与考勤结果相对应的预测结果；其中，预测结果至少包括是否存在考勤异常的判定内容；接收预测指令，根据预测指令中的未来时段，获取每一特征在未来时段内所对应的第二特征数据，将第二特征数据输入预测模型，通过预测模型输出预测结果。本申请具有对考勤异常与否的预测，减少因频繁出现考勤异常而增加管理人员工作负担的效果。

Description

一种基于机器学习模型对考勤异常的预测及处理方法

技术领域

本申请涉及考勤技术领域，尤其是涉及一种基于机器学习模型对考勤异常的预测及处理方法。

背景技术

目前，大部分企业为了实现对员工的管理，通常会设置考勤制度，员工在手机端或电脑端登录访问考勤***并进行签到或签退，而现有的考勤***具有存储各员工的考勤数据的功能，企业管理人员能够通过调取历史时期（如过去一整个月）的考勤数据来获知员工的考勤情况；并在出现考勤异常时，分析异常原因，并采取处理措施，如让员工提出补卡请求，再由管理人员审批补卡请求。

然而，上述考勤数据将随着企业内考勤员工数量、以及考勤天数的增大而持续积累存储在考勤***内，而企业内考勤员工数量的激增，也易导致出现考勤异常数据的数量的增大，相应的补卡审批流程增多，继而也将导致管理人员需要频繁审批补卡请求，增大了管理人员的工作负担，故有待改善。

发明内容

为了减少因频繁出现考勤异常而增加管理人员工作负担的技术问题，本申请提供一种基于机器学习模型对考勤异常的预测及处理方法。

第一方面，本申请提供了一种基于机器学习模型对考勤异常的预测及处理方法，采用如下的技术方案：

获取指定历史时期的考勤数据，对所述考勤数据进行预处理得到考勤结果；

根据所述考勤结果，以及预设的特征集，获取与所述特征集内的每一特征相对应的第一特征数据；

将所述第一特征数据输入预构建的预测模型，对预测模型进行训练，以使得所述预测模型输出与所述考勤结果相对应的预测结果；其中，所述预测结果至少包括是否存在考勤异常的判定内容；

接收预测指令，根据所述预测指令中的未来时段，获取每一特征在所述未来时段内所对应的第二特征数据，将所述第二特征数据输入预测模型，通过所述预测模型输出预测结果。

通过采用上述技术方案，以历史考勤数据作为训练集来训练预构建的预测模型，再通过预测模型来对预测时段进行预测，以得出预测结果，其中，预测结果至少包含了对未来时段内是否会存在考勤异常情况的内容，以便管理人员提前制定好处理方案，如提前提示考勤员工注意考勤规范，从而减少出现考勤异常的数量，进而减少因考勤异常繁多而增大管理人员对补卡审批流程的处理负担。

可选的，所述考勤数据至少包括考勤人员、实际打卡时间；若所述判定内容为存在考勤异常，则所述预测结果还包括异常数量、异常原因和异常时间；

所述对所述考勤数据进行预处理得到考勤结果，包括：

根据每一所述考勤数据，判定所述考勤数据的结果类型，所述结果类型分为异常和正常；

根据所述实际打卡时间，确定所述结果类型为异常的每一考勤数据的异常原因，所述异常原因至少包括漏签、考勤错误；

为结果类型为正常的每一考勤数据生成第一考勤结果，所述第一考勤结果至少包括考勤人员、结果类型；

为结果类型为异常的每一考勤数据生成第二考勤结果，所述第二考勤结果至少包括考勤人员、结果类型、异常原因和异常时间；其中，所述考勤结果包括第一考勤结果和/或第二考勤结果。

通过采用上述技术方案，在对预测模型进行训练，或利用预测模型对未来时段的考勤情况进行预测之前，本申请将对考勤数据进行预处理，而预处理的内容具体包括判定考勤数据是否为异常，若异常则判定其异常原因，在利用该考勤结果以及获取到的第一特征数据来对预测模型进行训练，以使得最终训练后的预测模型不仅可以判定是否异常，还能够判定异常原因和异常时间，且当将所有考勤员工的第一特征数据均输入预测模型时，自然也就能够预测出所有考勤员工中出现异常的异常数量。

可选的，所述考勤数据至少包括考勤人员、应打卡时段、实际打卡时间；

所述方法还包括：

接收缺勤申请，根据所述缺勤申请中的申请人员、缺勤时段，生成缺勤数据，存储至预设的缺勤数据库中；

所述对所述考勤数据进行预处理，包括：

若所述考勤数据中存在第一考勤数据，则将所述第一考勤数据移除所述考勤数据；其中，所述第一考勤数据满足：在所述缺勤数据库中存在缺勤数据，且该缺勤数据的缺勤人员、缺勤时段与所述第一考勤数据的考勤人员以及应打卡时段相对应。

通过采用上述技术方案，缺勤申请是指考勤人员因请假或因外勤而无法正常考勤时所提出的申请，提出缺勤申请的人员其对应的缺勤时段的考勤数据势必是异常的，而该异常的考勤数据（即第一考勤数据）并不能作为预测模型的输入，因此，在对预测模型进行训练之前，将预先剔除第一考勤数据，以确保预测模型的训练准确度。

可选的，所述特征集中所包含的特征分为恒定特征和可变特征两类，所述恒定特征是指不会变动的特征，所述可变特征是指随时间变化的特征，所述可变特征至少可以包括人流量、网络拥塞度；

所述方法还包括：

获取每一所述可变特征随时间变化的第三特征数据，基于所述第三特征数据，为每一所述可变特征拟合生成变化曲线，所述变化曲线是指可变特征所对应的第三特征数据随时间变化的曲线；

所述获取每一特征在所述未来时段内所对应的第二特征数据，将所述第二特征数据输入预测模型，通过所述预测模型输出预测结果，包括：

确定未来时段内的每一所述可变特征所对应的变化曲线，并基于所有所述可变特征在未来时段内的变化曲线，确定最小分割时长；

根据所述最小分割时长，将所述未来时段分给为若干个子时段；

按照子时段的时间先后顺序，分别执行：将每一所述恒定特征所对应的第五特征数据，以及同一目标子时段内的所有可变特征所对应的第四特征数据输入预测模型，通过预测模型输出所述目标子时段所对应的预测结果，直至通过预测模型输出所有所述子时段所对应的预测结果；其中，所述目标子时段指任一子时段。

通过采用上述技术方案，由于可变特征所对应的数据数值是随时间变化的，即，在预测指令所规定的未来时段内，可变特征所对应的数据数值不一定是定值，如作为网络拥塞度的可变特征，网络拥塞度将影响出勤人员能否成功访问打卡***并打卡，但网络拥塞度在不同时刻时的数值不一定相同，因此，可将未来时段分割为多个子时段，并分别预测对每一子时段内是否存在异常考勤的情况进行预测，提高预测精准度。

可选的，所述方法还包括：

若所述预测结果中包含了存在异常的判定内容，则基于所述预测结果，确定潜在异常人员，所述目标考勤人员是指在对应的考勤数据在未来时段的结果类型为异常的考勤人员；

向所述潜在异常人员发送提示信息。

通过采用上述技术方案，根据预测模型预测得出的预测结果，若预测得出在未来时段存在异常，那么可找到该异常发生的考勤人员（即潜在异常人员），并对该潜在异常人员进行预警，以便降低其在未来时段产生异常的考勤数据的可能。

可选的，所述方法还包括：

若存在第二考勤数据，则将第二考勤数据所对应的考勤人员作为潜在异常人员，向所述潜在异常人员发送提示信息；其中，所述第二考勤数据是指考勤数据满足预设考勤要求，但对应的考勤时间与预设的考勤绝限时间的差值小于预设的临界差值的考勤数据。

通过采用上述技术方案，对于正常的考勤数据，如若该考勤数据中的考勤时间与规定的考勤绝限时间十分临近（即两者差值小于临界差值），那么其对应的考勤人员（即潜在异常人员）也存在出现异常考勤数据的风险，为此，本申请提出对潜在异常人员进行预警，从而给降低其在未来时段产生异常的考勤数据的可能。

可选的，所述考勤数据还包括考勤地点，所述方法还包括：

接收自动考勤指令，实时跟踪触发所述自动考勤指令的考勤人员的位置，当所述位置进入或离开预设的考勤区域时，且当前时刻满足预设考勤要求时，为所述考勤人员生成并存储考勤数据。

通过采用上述技术方案，本申请提出了为考勤人员实现自动打卡、自动生成考勤数据的功能，从而减少考勤人员因忘记打卡等原因而产生异常数据的情况的发生。

第二方面，本申请提供了基于机器学习模型对考勤异常的预测及处理***，包括：

考勤数据处理模块，用于获取指定历史时期的考勤数据，对所述考勤数据进行预处理得到考勤结果；

特征数据获取模块，用于根据所述考勤结果，以及预设的特征集，获取与所述特征集内的每一特征相对应的第一特征数据；

预测模型训练模块，用于将所述第一特征数据输入预构建的预测模型，对预测模型进行训练，以使得所述预测模型输出与所述考勤结果相对应的预测结果；其中，所述预测结果至少包括是否存在考勤异常的判定内容；

考勤异常预测模块，用于接收预测指令，根据所述预测指令中的未来时段，获取每一特征在所述未来时段内所对应的第二特征数据，将所述第二特征数据输入预测模型，通过所述预测模型输出预测结果。

第三方面，本申请提供了一种基于机器学习模型对考勤异常的预测及处理装置，包括存储器和处理器，所述存储器上存储有能够被处理器加载并执行如第一方面中任一种方法的计算机程序。

第四方面，本申请提供了一种计算机可读存储介质，其特征在于，存储有能够被处理器加载并执行如第一方面中任一种方法的计算机程序。

综上所述，本申请包括以下有益技术效果：

以历史考勤数据作为训练集来训练预构建的预测模型，再通过预测模型来对预测时段进行预测，以得出预测结果，其中，预测结果至少包含了对未来时段内是否会存在考勤异常情况的内容，以便管理人员提前制定好处理方案，如提前提示考勤员工注意考勤规范，从而减少出现考勤异常的数量，进而减少因考勤异常繁多而增大管理人员对补卡审批流程的处理负担。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例公开的基于机器学习模型对考勤异常的预测及处理方法的流程示意图。

图2是本申请实施例公开的基于机器学习模型对考勤异常的预测及处理***的流程框图。

附图标记说明：1、考勤数据处理模块；2、特征数据获取模块；3、预测模型训练模块；4、考勤异常预测模块。

具体实施方式

以下结合附图1-2对本申请作进一步详细说明。

本申请实施例公开一种基于机器学习模型对考勤异常的预测及处理方法（下文简称为预测及处理方法），该预测及处理方法用于基于历史时期的考勤数据进行处理分析，并利用该考勤数据对预构建的预测模型进行训练，再通过该预测模型来预测未来时段内是否会出现异常考勤，以及如若出现异常考勤，那么将对应预测得出的异常考勤数量、出现异常考勤的时间段、出现异常考勤的原因等。相应的，上述预测及处理方法的执行主体为基于机器学习模型对考勤异常的预测及处理***（下文简称为预测及处理***），预测及处理***用于存储与考勤相关的数据，并对考勤异常情况进行分析预测。具体的，下文将结合附图1来对预测及处理***执行预测及处理方法的具体步骤进行详细阐述。

S101，获取指定历史时期的考勤数据，对考勤数据进行预处理得到考勤结果。

在实施中，本申请的预测及处理***可具有考勤功能，具体的，考勤人员可通过智能移动端或电脑端访问预测及处理***，并在访问时录入个人信息（如姓名、工号等），考勤***将显示可供考勤人员进行考勤打卡的考勤界面，并每隔指定考勤时长（如一天）重置该考勤界面，该考勤界面上至少包括用于供考勤人员点触的考勤按钮。考勤***将在出现下述特定情况时，自动生成并存储考勤数据；其中，特定情况可以为：当考勤人员点触签到考勤按钮时；或当指定考勤时长内未收到考勤人员点触考勤按钮时。其中，考勤按钮可以为签到按钮和/或签退按钮。

考勤数据至少包括考勤人员的个人信息（如姓名、工号）、应打卡时段、实际打卡时间、考勤位置；且应打卡时段是指指定考勤时长内除工作时段之外的时段，可以表现为X年X月X日X时X分-X年X月X日Y时Y分；实际打卡时间是指考勤人员点触考勤按钮时的时间点，可以表现为：XX时XX分，若在指定时长内未检测到考勤人员点触考勤按钮，那么实际打卡时间的具体内容可以为null。

指定历史时期包括若干个指定考勤时长，如当前时刻之前的一周内，可每隔指定历史时期，获取指定历史时期的考勤数据，并对考勤数据进行预处理得到考勤结果，具体的，S101中的“对考勤数据进行预处理得到考勤结果”具体还包括如下子步骤：

根据每一考勤数据，判定考勤数据的结果类型，结果类型分为异常和正常；

根据考勤时间，确定结果类型为异常的每一考勤数据的异常原因，异常原因至少包括漏签、考勤错误；

为结果类型为正常的每一考勤数据生成第一考勤结果，第一考勤结果至少包括考勤人员、结果类型；

为结果类型为异常的每一考勤数据生成第二考勤结果，第二考勤结果至少包括考勤人员、结果类型、异常原因和异常时间；其中，考勤结果包括第一考勤结果和/或第二考勤结果。

在实施中，由于考勤数据分为正常和异常两类考勤数据，如前文所述的当实际打卡时间为null时，该考勤数据势必存在异常；因此，当预测及处理***从所存储的考勤数据中获取到指定历史时期的所有考勤数据之后，可对考勤数据的结果类型进行判定，以判定对应的考勤数据是否异常，再对异常的考勤数据分析其异常原因，具体的，当实际打卡时间为null时，对应的考勤原因为漏签，当实际打卡时间在实际打卡时段之外时，对应的考勤原因为考勤错误；当实际打卡时间在实际打卡时段内，但考勤位置不在预设的考勤区域内时，对应的考勤原因为考勤错误。

实际打卡时间在实际打卡时段内、考勤位置在预设的考勤区域内的考勤数据的结果类型为正常；反之，结果类型即为异常。第一考勤结果是指结果类型为正常的考勤数据所对应生成的考勤结果，其包括考勤人员和结果类型；第二考勤数据即为结果类型为异常的考勤数据所对应生成的考勤结果，其具体包括考勤人员、结果类型、异常原因和异常时间。其中，对于结果类型为异常的考勤数据，若对应的实际打卡时间非null，那么异常时间的具体数值即为该实际打卡时间数值，若对应的实际打卡时间为null，那么异常时间的具体数值即为预先设定的数值。

可选的，预测及处理方法还包括：

接收缺勤申请，根据缺勤申请中的申请人员、缺勤时段，生成缺勤数据，存储至预设的缺勤数据库中；

S101中的“对考勤数据进行预处理得到考勤结果”具体包括如下子步骤：

若考勤数据中存在第一考勤数据，则将第一考勤数据移除考勤数据；其中，第一考勤数据满足：在缺勤数据库中存在缺勤数据，且该缺勤数据的缺勤人员、缺勤时段与第一考勤数据的考勤人员以及应打卡时段相对应。

在实施中，缺勤申请包括外勤申请和请假申请两种情况，其共通点为：发起该缺勤申请的申请人员将无法在缺勤时段内实现正常考勤，相应的，该申请人员在缺勤时段所对应的考勤数据的实际打卡时间将为null，此类考勤数据（即第一考勤数据）将被从获取到的指定历史时期的考勤数据中剔除，而该剔除操作则属于预处理操作，具体的，当预测及处理***获取到指定历史时期内的考勤数据之后，可以先筛选出实际打卡时间为null的考勤数据，再根据此类考勤数据的应打卡时段，换算出对应的工作时段，接着利用换算得出的工作时段与缺勤数据库中的每一缺勤数据的缺勤时段进行比对，利用考勤人员与缺勤数据库中的每一缺勤数据的缺勤人员进行比对，若存在某一缺勤数据和某一考勤数据，且对应的缺勤人员与考勤人员相一致、对应的缺勤时段与换算得出的工作时段相一致，则说明该考勤数据为需要被剔除的第一考勤数据。

S102，根据考勤结果，以及预设的特征集，获取与特征集内的每一特征相对应的第一特征数据；

在实施中，特征集是特征的集合，而特征是影响考勤异常的因素，如天气，恶劣天气将导致交通拥堵，进而导致考勤人员不能出现迟到等情况，从而出现异常考勤；如网络拥塞度，当预测及处理***在某一时刻的访问量较大而导致网络拥堵时，考勤人员即便点触了打卡按钮，也会出现打卡失败的异常考勤情况；如工作性质，若某位考勤人员的工作性质为销售等需要经常外勤公出的内容，那么该考勤人员将因远离预设的考勤区域而无法考勤，并出现异常考勤的情况......因此，特征可以分为恒定特征和可变特征两类，其中恒定特征是指在短期内不会随时间变化的特征，在本申请中具体指与考勤人员相关的特征，如考勤人员的姓名、职级、工作性质、星座等；可变特征是指随时间变化的特征，如天气、网络拥塞度等会实时发生变化的特征。

特征数据是指特征所对应的数据，如天气状况，本申请实施例中默认天气状况具体为良好、恶劣两种，而具体判定良好还是恶劣的方式可以为：将晴、多云、阴确定为良好，其余确定为恶劣；如网络拥塞度具体可以为拥堵和通畅两种，而判定拥堵还是通畅的方式可以为：访问量大于指定量值时为拥堵，不大于指定量值时为通畅。对于恒定特征相对应的特征数据，本申请将预先存储于预设的特征数据库中，对于可变特征相对应的特征数据，预测及处理***可预先与第三方平台通信连接，如与天气预测平台进行通信，以便获取对应的特征数据。

当预测及处理***获取到指定历史时期内的考勤数据后，将确定指定历史时期内的每一个指定考勤时长所对应的特征数据（即第一特征数据），该特征数据包括该单个指定考勤时长内所对应的可变特征，以及每一考勤人员所对应的恒定特征。

S103，将第一特征数据输入预构建的预测模型，对预测模型进行训练，以使得预测模型输出与考勤结果相对应的预测结果；其中，预测结果至少包括是否存在考勤异常的判定内容。

在实施中，判定内容对应前文的结果类型，如异常或正常。本申请的预测模型用于对未来时段内是否会存在考勤异常进行预测，预测模型的输入为特征数据，输出为预测结果，预测结果与考勤结果相对应，在训练预测模型时，可将指定历史时期所获取的第一特征数据作为预测模型的输入，将前文所确定得出的考勤结果作为输出，实现对预测模型的训练，以使得预测模型记忆第一特征数据与考勤结果的对应关系，从而方便预测模型在后续能够基于所记忆的对应关系，来根据未来时段的特征数据进行预测输出对应的预测结果。此外，本申请实施例所公开的预测模型可以为基于机器学习的预测模型，如决策树模型，而基于机器学习的预测模型的具体预测原理为现有技术，在此不再赘述。

在本申请实施例中，可以以考勤人员和指定考勤时期为单位来向预测模型输入第一特征数据，实现对预测模型的训练，即针对单人单日的第一特征数据以及对应的考勤结果来训练预测模型。如将某一指定考勤时长内的某位考勤人员所对应的第一特征数据（包括该考勤人员的恒定特征所对应的特征数据，以及该指定考勤时长内的可变特征所对应的特征数据）输入预测模型，对预测模型进行训练，使得输出的预测结果对应考勤结果。以此来方便预测模型记忆每一考勤员工所对应的特征数据以及考勤结果的对应关系，方便在预测模型在后续能够基于该考勤员工所记忆的对应关系，根据每一考勤员工在未来时段的特征数据，对每一考勤员工的考勤结果进行预测。

S104，接收预测指令，根据预测指令中的未来时段，获取每一特征在未来时段内所对应的第二特征数据，将第二特征数据输入预测模型，通过预测模型输出预测结果。

在实施中，预测指令可以为人为手动触发，也可以为预测及处理***定期（如每天）自动触发；预测指令可以用于预测某一考勤员工在未来时段的考勤情况，也可以预测某些考勤员工（如整个公司）在未来时段的考勤情况。预测结果至少包括是否存在考勤异常的判定内容（判定内容如：异常或正常）、异常数量、异常原因和异常时间。未来时段是指晚于触发预测指令时的时间段，第二特征数据是指在每一特征在未来时段内所对应的特征数据。

结合前文，预测模型可对每一考勤员工在未来时段内的考勤情况进行逐一预测，以此来获知所有被预测的考勤员工中出现异常考勤的数量，即预测结果中所对应的异常数量，而由于在训练预测模型时，考勤结果中包含了异常原因和异常时间，且预测结果与考勤结果相对应，因此，在通过训练后的预测模型进行预测时，其所输出的预测结果中将包含异常原因和异常时间。

此处需要说明的，由于可变特征所对应的特征数据在未来时段内易出现变化，即不易为定值，因此，若不是定值，那么可取在未来时段内的不同时刻时出现频率最高的值，或取在未来时段内不同时刻时的平均值作为对应的第一特征数据。

可选的，预测及处理方法还包括如下方法还应对可变特征在未来时段内的取值并非定值的问题，具体包括如下步骤：

获取每一可变特征随时间变化的第三特征数据，基于第三特征数据，为每一可变特征拟合生成变化曲线，变化曲线是指可变特征所对应的第三特征数据随时间变化的曲线；

S104中的“获取每一特征在未来时段内所对应的第二特征数据，将第二特征数据输入预测模型，通过预测模型输出预测结果”包括：

确定未来时段内的每一可变特征所对应的变化曲线，并基于所有可变特征在未来时段内的变化曲线，确定最小分割时长；

根据最小分割时长，将未来时段分给为若干个子时段；

按照子时段的时间先后顺序，分别执行：将每一恒定特征所对应的第五特征数据，以及同一目标子时段内的所有可变特征所对应的第四特征数据输入预测模型，通过预测模型输出目标子时段所对应的预测结果，直至通过预测模型输出所有子时段所对应的预测结果；其中，目标子时段指任一子时段。

在实施中，预测及处理***将获取每一指定考勤时长内，不同时刻时，可变特征所对应的特征数据（即第三特征数据），并拟合生成变化曲线，再将指定历史时期内，同一可变特征在不同考勤指定时长时所对应的变化曲线求平均（具体通过对每一时刻的第三特征数据进行求平均，最终利用不同时刻的平均值形成最终的变化曲线），最终得到每一可变特征的变化曲线。

接着，预测及处理***分析每一可变特征最终得到的变化曲线，分别计算每一变化曲线上的特征数据的随时间的变化速率，该变化速率是指相邻时刻点所对应的特征数据之间的变化速率，确定每一变化速率值是否落在预设速率范围内，并找出分界时间点，分界时间点是指对应时刻的变化速率值，以及分界时间点前一时刻所对应的变化速率值，两者中的其一位于预设速率范围内，另一位于变化速率范围外；计算得出同一变化曲线上所对应找到的相邻分界时间点之间的分割时长，最后找到所有变化曲线中的最小分割时长；利用该最小分割时长，将未来时段分割为若干个子时段，除最后一个子时段之外的其他子时段的时长与最小分割时长相一致，最后一个子时段的时长不大于最小分割时长。

最后，预测及处理方法将利用预测模型，对所有子时段的考勤情况逐一进行预测，最终得到的预测结果为每一子时段所对应的预测结果的总和，实现分段预测，以使得预测结果更为精准。其中，第五特征数据是指恒定特征所对应的特征数据，第四特征数据是指每一可变特征在对应子时段内时所对应的特征数据（该特征数据取值可以为该可变特征在该子时段内、不同时刻的所有特征数据的平均值，或出现频率最高的取值）。

可选的，预测及处理方法还包括：

若预测结果中包含存在异常的判定内容，则基于预测结果，确定潜在异常人员，目标考勤人员是指在对应的考勤数据在未来时段的结果类型为异常的考勤人员；

若存在第二考勤数据，则将第二考勤数据所对应的考勤人员作为潜在异常人员，其中，第二考勤数据是指考勤数据满足预设考勤要求，但对应的考勤时间与预设的考勤绝限时间的差值小于预设的临界差值的考勤数据；

向潜在异常人员发送提示信息。

在实施中，潜在异常人员是指在预测指令中提到的未来时段内，对应的考勤数据的结果类型大概率为异常的考勤人员；潜在异常人员分为两类，其中一类是指通过预测模型预测得出的、对应的考勤数据的结果类型大概率为异常的考勤人员；另一类是指在历史时期的考勤数据中，虽然并未异常，但是处在异常边缘的考勤人员。对于第一类，结合前文可知，本申请的预测模型可以结合每一考勤人员所对应的恒定特征的特征数据，以及可变特征在未来时段时所对应的特征数据，对单个考勤人员在未来时段内是否会出现考勤异常的情况进行单独预测，因此，预测及处理***可在预测模型预测得出预测结果之后，确定得到存在异常考勤所对应的具体的考勤人员（即潜在异常人员）。

对于第二类，预测及处理***可获取每一考勤人员在当前时刻之前的固定时长内（如当前时刻之前的三个指定考勤时长内）的所有实际打卡时间，确定实际打卡时间（如8时28分）与预设的考勤绝限时间（如8时30分）之间的差值，若该差值小于预设的临界差值（如3分钟），则对应的考勤人员为潜在异常人员。

最后，预测及处理***将向对应的潜在异常人员的访问预测及处理***的访问账号发送提示信息，以提醒对应的潜在异常人员注意考勤规范性；另外，预测及处理***发送提示信息的时间可以为未来时段内的应打卡时段，以便潜在异常人员在看到提示信息的当下即进行打卡操作。

可选的，预测及处理方法还包括：

接收自动考勤指令，实时跟踪触发自动考勤指令的考勤人员的位置，当位置进入或离开预设的考勤区域时，且当前时刻满足预设考勤要求时，为考勤人员生成并存储考勤数据。

在实施中，本申请的预测及处理***还可以提供自动考勤功能，当考勤人员触发自动考勤指令时，预测及处理***将自动为该考勤人员启动自动考勤模式，并在每一指定考勤时长内，在对应的应打卡时段自动生成考勤数据；即自动生成考勤数据的特定情况除了前文所述的两种情况之外，还包括：每隔指定考勤时长，在对应的应打卡时段内，实时确定考勤人员的位置，当该位置落入预设的考勤区域内时，自动生成考勤数据；其中，上文提及的预设考勤要求是指位置落入预设的考勤区域内时所对应的时刻，处于应打卡时段内。

本申请实施例还公开一种基于机器学习模型对考勤异常的预测及处理***。参照图2，基于机器学习模型对考勤异常的预测及处理***包括：

考勤数据处理模块1，用于获取指定历史时期的考勤数据，对考勤数据进行预处理得到考勤结果；

特征数据获取模块2，用于根据考勤结果，以及预设的特征集，获取与特征集内的每一特征相对应的第一特征数据；

预测模型训练模块3，用于将第一特征数据输入预构建的预测模型，对预测模型进行训练，以使得预测模型输出与考勤结果相对应的预测结果；其中，预测结果至少包括是否存在考勤异常的判定内容；

考勤异常预测模块4，用于接收预测指令，根据预测指令中的未来时段，获取每一特征在未来时段内所对应的第二特征数据，将第二特征数据输入预测模型，通过预测模型输出预测结果。

可选的，考勤数据至少包括考勤人员、实际打卡时间；若判定内容为存在考勤异常，则预测结果还包括异常数量、异常原因和异常时间；

考勤数据处理模块1还用于根据每一考勤数据，判定考勤数据的结果类型，结果类型分为异常和正常；根据实际打卡时间，确定结果类型为异常的每一考勤数据的异常原因，异常原因至少包括漏签、考勤错误；为结果类型为正常的每一考勤数据生成第一考勤结果，第一考勤结果至少包括考勤人员、结果类型；为结果类型为异常的每一考勤数据生成第二考勤结果，第二考勤结果至少包括考勤人员、结果类型、异常原因和异常时间；其中，考勤结果包括第一考勤结果和/或第二考勤结果。

可选的，考勤数据至少包括考勤人员、应打卡时段、实际打卡时间；

还包括缺勤数据存储模块，用于接收缺勤申请，根据缺勤申请中的申请人员、缺勤时段，生成缺勤数据，存储至预设的缺勤数据库中；

考勤数据处理模块1还用于若考勤数据中存在第一考勤数据，则将第一考勤数据移除考勤数据；其中，第一考勤数据满足：在缺勤数据库中存在缺勤数据，且该缺勤数据的缺勤人员、缺勤时段与第一考勤数据的考勤人员以及应打卡时段相一致。

可选的，特征集中所包含的特征分为恒定特征和可变特征两类，恒定特征是指不会变动的特征，可变特征是指随时间变化的特征，可变特征至少可以包括人流量、网络拥塞度；

还包括可变特征数据拟合模块，用于获取每一可变特征随时间变化的第三特征数据，基于第三特征数据，为每一可变特征拟合生成变化曲线，变化曲线是指可变特征所对应的第三特征数据随时间变化的曲线；

考勤异常预测模块4，还用于确定未来时段内的每一可变特征所对应的变化曲线，并基于所有可变特征在未来时段内的变化曲线，确定最小分割时长；根据最小分割时长，将未来时段分给为若干个子时段；还用于按照子时段的时间先后顺序，分别执行：将每一恒定特征所对应的第五特征数据，以及同一目标子时段内的所有可变特征所对应的第四特征数据输入预测模型，通过预测模型输出目标子时段所对应的预测结果，直至通过预测模型输出所有子时段所对应的预测结果；其中，目标子时段指任一子时段。

可选的，还包括潜在异常提示模块，用于若预测结果中包含存在异常的判定内容，则基于预测结果，确定潜在异常人员，目标考勤人员是指在对应的考勤数据在未来时段的结果类型为异常的考勤人员；还用于若存在第二考勤数据，则将第二考勤数据所对应的考勤人员作为潜在异常人员，向潜在异常人员发送提示信息；其中，第二考勤数据是指考勤数据满足预设考勤要求，但对应的考勤时间与预设的考勤绝限时间的差值小于预设的临界差值的考勤数据；还用于向潜在异常人员发送提示信息。

可选的，考勤数据还包括考勤地点；

预计及处理***还包括自动考勤模块，用于接收自动考勤指令，实时跟踪触发自动考勤指令的考勤人员的位置，当位置进入或离开预设的考勤区域时，且当前时刻满足预设考勤要求时，为考勤人员生成并存储考勤数据。

本申请实施例还公开一种基于机器学习模型对考勤异常的预测及处理装置，基于机器学习模型对考勤异常的预测及处理装置包括存储器和处理器，存储器上存储有能够被处理器加载并执行如上述的基于机器学习模型对考勤异常的预测及处理方法的计算机程序。

本申请实施例还公开一种计算机可读存储介质，其存储有能够被处理器加载并执行如上述的基于机器学习模型对考勤异常的预测及处理方法的计算机程序，该计算机可读存储介质例如包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上实施例仅用以说明本申请的技术方案，而非对申请的保护范围进行限制。显然，所描述的实施例仅仅是本申请部分实施例，而不是全部实施例。基于这些实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请所要保护的范围。

Claims

1.一种基于机器学习模型对考勤异常的预测及处理方法，其特征在于，包括：

2.根据权利要求1所述的基于机器学习模型对考勤异常的预测及处理方法，其特征在于，所述考勤数据至少包括考勤人员、实际打卡时间；若所述判定内容为存在考勤异常，则所述预测结果还包括异常数量、异常原因和异常时间；

所述对所述考勤数据进行预处理得到考勤结果，包括：

3.根据权利要求1所述的基于机器学习模型对考勤异常的预测及处理方法，其特征在于，所述考勤数据至少包括考勤人员、应打卡时段、实际打卡时间；

所述方法还包括：

所述对所述考勤数据进行预处理，包括：

4.根据权利要求1所述的基于机器学习模型对考勤异常的预测及处理方法，其特征在于，所述特征集中所包含的特征分为恒定特征和可变特征两类，所述恒定特征是指不会变动的特征，所述可变特征是指随时间变化的特征，所述可变特征至少可以包括人流量、网络拥塞度；

所述方法还包括：

5.根据权利要求1所述的基于机器学习模型对考勤异常的预测及处理方法，其特征在于，所述方法还包括：

向所述潜在异常人员发送提示信息。

6.根据权利要求1所述的基于机器学习模型对考勤异常的预测及处理方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的基于机器学习模型对考勤异常的预测及处理方法，其特征在于，所述考勤数据还包括考勤地点，所述方法还包括：

8.一种基于机器学习模型对考勤异常的预测及处理***，其特征在于，包括，

考勤数据处理模块（1），用于获取指定历史时期的考勤数据，对所述考勤数据进行预处理得到考勤结果；

特征数据获取模块（2），用于根据所述考勤结果，以及预设的特征集，获取与所述特征集内的每一特征相对应的第一特征数据；

预测模型训练模块（3），用于将所述第一特征数据输入预构建的预测模型，对预测模型进行训练，以使得所述预测模型输出与所述考勤结果相对应的预测结果；其中，所述预测结果至少包括是否存在考勤异常的判定内容；

考勤异常预测模块（4），用于接收预测指令，根据所述预测指令中的未来时段，获取每一特征在所述未来时段内所对应的第二特征数据，将所述第二特征数据输入预测模型，通过所述预测模型输出预测结果。

9.一种基于机器学习模型对考勤异常的预测及处理装置，其特征在于，包括存储器和处理器，所述存储器上存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。

10.一种计算机可读存储介质，其特征在于，存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。