WO2020119105A1

WO2020119105A1 - 基于大数据的支付超量识别方法、设备、存储介质及装置

Info

Publication number: WO2020119105A1
Application number: PCT/CN2019/095412
Authority: WO
Inventors: 黄越; 陈明东
Original assignee: 平安医疗健康管理股份有限公司
Priority date: 2018-12-13
Filing date: 2019-07-10
Publication date: 2020-06-18
Also published as: CN109658265A

Abstract

一种基于大数据的支付超量识别方法、设备、存储介质及装置，该方法包括：获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据（S10），根据所述标准化支付数据统计所述患者的周期性支付费用（S20），通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值（S30）。

Description

基于大数据的支付超量识别方法、设备、存储介质及装置

本申请要求于2018年12月13日提交中国专利局、申请号为201811530549.6、发明名称为“基于大数据的支付超量识别方法、设备、存储介质及装置”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及异常数据识别技术领域，尤其涉及一种基于大数据的支付超量识别方法、设备、存储介质及装置。

背景技术

由于医保体系的不完善，参保人在医院治疗期间，可能会出现某几个时期支付抗排异药物的费用过高的情形，例如：首年支付抗排异药物的费用超过10万，或者，除首年外的年份，每年支付抗排异药物的费用超过8万。

目前对上述支付超量情形进行排查的主要手段是：人社局工作人员在庞大的诊疗明细数据中查找并核对收费是否异常，然而，该手段易出现两类问题，一是人工排查难免存在疏漏，二是效率较低、耗时较长及成本较高。

上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

发明内容

本申请的主要目的在于提供一种基于大数据的支付超量识别方法、设备、存储介质及装置，旨在解决现有技术中如何更便捷地判断抗排异药物的支付费用是否超量的技术问题。

为实现上述目的，本申请提供一种基于大数据的支付超量识别方法，所述基于大数据的支付超量识别方法包括以下步骤：

获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据；

根据所述标准化支付数据统计所述患者的周期性支付费用；

通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。

此外，为实现上述目的，本申请还提出一种用户设备，所述用户设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令配置为实现如上所述的基于大数据的支付超量识别方法的步骤。

此外，为实现上述目的，本申请还提出一种存储介质，所述存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上文所述的基于大数据的支付超量识别方法的步骤。

此外，为实现上述目的，本申请还提出一种基于大数据的支付超量识别装置，所述基于大数据的支付超量识别装置包括：

处理模块，用于获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据；

统计模块，用于根据所述标准化支付数据统计所述患者的周期性支付费用；

挖掘模块，用于通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。

本申请中，通过获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据，根据所述标准化支付数据统计所述患者的周期性支付费用，通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。由于对患者的抗排异支付数据进行标准化与统计，获得了周期性支付费用，从而能够根据预设基于单元的孤立点检测算法准确地判断周期性支付费用是否超量，从而督促医院合理收费，保障患者的利益。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的用户设备结构示意图；

图2为本申请基于大数据的支付超量识别方法第一实施例的流程示意图；

图3为本申请基于大数据的支付超量识别方法第二实施例的流程示意图；

图4为本申请基于大数据的支付超量识别方法第三实施例的流程示意图；

图5为本申请基于大数据的支付超量识别装置第一实施例的结构框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，图1为本申请实施例方案涉及的硬件运行环境的用户设备结构示意图。

如图1所示，该用户设备可以包括：处理器1001，例如中央处理器(Central Processing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)，可选用户接口1003还可以包括标准的有线接口、无线接口，对于用户接口1003的有线接口在本申请中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity，WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory，RAM)存储器，也可以是稳定的存储器(Non-volatile Memory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对用户设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及基于大数据的支付超量识别程序。

在图1所示的用户设备中，网络接口1004主要用于连接后台服务器，与所述后台服务器进行数据通信；用户接口1003主要用于连接外设，与所述外设进行数据通信；所述用户设备通过处理器1001调用存储器1005中存储的计算机可读指令，并执行本申请实施例提供的基于大数据的支付超量识别方法。

基于上述硬件结构，提出本申请基于大数据的支付超量识别方法的实施例。

参照图2，图2为本申请基于大数据的支付超量识别方法第一实施例的流程示意图，提出本申请基于大数据的支付超量识别方法第一实施例。

在第一实施例中，所述基于大数据的支付超量识别方法包括以下步骤：

步骤S10：获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据。

需要说明的是，本实施例的执行主体是用户设备，所述用户设备可为个人电脑或服务器等电子设备，本实施例的应用场景是，患者在医院治疗时刷医保卡即时结算诊疗费用，医保卡就会记录患者的抗排异支付数据，所述抗排异支付数据包括收费时间、药物名称及收费金额等，并将该抗排异支付数据上传至人社核心***，每隔固定时间，例如，一年，用户将使用所述用户设备对患者的抗排异支付数据进行异常挖掘，判断一段时间(比如一个月)的抗排异支付数据对应的支付金额是否超过阈值，从而避免门诊不合理的收费情形，保障患者的利益。所述人社核心***记载的抗排异支付数据一般为不规范的文本信息，为了方便地判断支付费用是否超量，将预先对所述抗排异支付数据进行标准化处理，将所述抗排异支付数据转化为计算机能够识别的标准化支付数据。

在具体实现中，所述用户设备根据患者的身份信息从人社核心***中获取患者的抗排异支付数据，以供后续判断一段时间的抗排异支付数据对应的支付金额是否超过阈值，所述患者身份信息包含患者姓名和身份证号等信息，所述身份证号用于确认患者身份和管理患者名单。本实施例利用神经语言程序学(Neuro-Linguistic Programming，NLP)技术将所述抗排异支付数据转化为标准化支付数据，通过向量表示所述抗排异支付数据中的词语，为了表示每个词语之间的联系，使用预设双向递归神经网络模型将向量编码为一个句子矩阵，并通过注意力模型将所述句子矩阵压缩为句向量，该句向量即为所述标准化支付数据。

步骤S20：根据所述标准化支付数据统计所述患者的周期性支付费用。

需要说明的是，所述周期性支付费用可以是月支付费用、季度支付费用或者年支付费用，本实施例对此不加以限制。为了判断患者的周期性支付费用是否超过阈值，将按照要求统计所述患者的周期性支付费用，例如，要求判断月支付费用是否超过1万元之前，将根据所述标准化支付数据统计所述患者每月的月支付费用，要求判断年支付费用是否超过10万元之前，将根据所述标准化支付数据统计所述患者每年的年支付费用。

步骤S30：通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。

需要说明的是，所述第一预设阈值为所述周期性支付费用对应的周期内允许支付的最高费用，若所述周期性支付费用超过所述第一预设阈值，则说明医院存在不合理的收费情形，若所述周期性支付费用不超过所述第一预设阈值，则说明医院收费较合理。

在具体实现中，由于本实施例是为了判断所述周期性支付费用是否超过第一预设阈值，而基于单元的孤立点检测算法用于检测数据集中是否存在孤立点，因此，根据这一特性，构造所述预设基于单元的孤立点检测算法，以查找所述周期性支付费用中的孤立点，该孤立点即超过了所述第一预设阈值。

在第一实施例中，通过获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据，根据所述标准化支付数据统计所述患者的周期性支付费用，通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。由于对患者的抗排异支付数据进行标准化与统计，获得了周期性支付费用，从而能够根据预设基于单元的孤立点检测算法准确地判断周期性支付费用是否超量，从而督促医院合理收费，保障患者的利益。

参照图3，图3为本申请基于大数据的支付超量识别方法第二实施例的流程示意图，基于上述图2所示的第一实施例，提出本申请基于大数据的支付超量识别方法的第二实施例。

在第二实施例中，所述步骤S30，具体包括：

根据第一预设阈值确定单元格边长，根据所述单元格边长将所述周期性支付费用所处的数据空间划分为若干单元格，并将所述周期性支付费用映射为所述单元格中的数据点。

需要说明的是，为了判断所述周期性支付费用是否超过第一预设阈值，将通过所述预设基于单元的孤立点检测算法进行判断。

在具体实现中，将所述周期性支付费用所处的数据空间划分为若干等边长的单元格，并将所述周期性支付费用映射为所述单元格中的数据点，其中，根据第一预设阈值和预设公式确定单元格边长，以所述单元格边长作为划分依据，该预设公式为：

其中，L为单元格边长，D为第一预设阈值。

判断所述单元格中的数据点是否为孤立点。

若所述单元格中的数据点为孤立点，则认定所述孤立点对应的周期性支付费用超过所述第一预设阈值。

可以理解的是，所述孤立点指的是没有足够多邻居的数据点，由于通过所述第一预设阈值确定了所述单元格边长，而预设基于单元的孤立点检测算法基于该单元格边长划分单元格，则检测出的孤立点，是相对于所述第一预设阈值的孤立点，因此，若单元格中的数据点为孤立点，则认定所述单元格中的孤立点对应的周期性支付费用超过所述第一预设阈值，若单元格中的数据点不是孤立点，则认定所述单元格中的数据点对应的周期性支付费用未超过所述第一预设阈值。

进一步地，所述步骤S30，包括：

步骤S301：根据第一预设阈值确定单元格边长，根据所述单元格边长将所述周期性支付费用所处的数据空间划分为若干单元格，并将所述周期性支付费用映射为所述单元格中的数据点。

步骤S302：遍历各单元格，统计各单元格中的第一数据点数目、各单元格的第一层邻居中的第二数据点数目以及各单元格的第二层邻居中的第三数据点数目。

可以理解的是，所述数据空间包含若干单元格，第一层邻居为相邻的一层单元格，第二层邻居为第一层邻居外的两层单元格，所述第一数据点数目为所述单元格中数据点的数目，所述第二数据点数目为所述单元格的第一层邻居中的数据点的数目，所述第三数据点数目为所述单元格的第二层邻居中的数据点的数目。

步骤S303：根据所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目判断所述单元格中的数据点是否为孤立点。

需要说明的是，根据所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目可判断所述单元格中的数据点的邻居数目，从而判断单元格中的数据点是否为孤立点。

在具体实现中，遍历各单元格，对每个单元格，均统计所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目，可判断每个单元格中的数据点是否为孤立点，判断每个单元格中的数据点对应的周期性支付费用是否超过第一预设阈值，从而实现准确全面地识别出超过第一预设阈值的周期性支付费用。

步骤S304：若所述单元格中的数据点为孤立点，则认定所述孤立点对应的周期性支付费用超过所述第一预设阈值。

进一步地，所述步骤S303，包括：

若所述第一数据点数目与所述第二数据点数目的和大于第二预设阈值，则认定所述单元格中的数据点不是孤立点；

若所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目的和不大于所述第二预设阈值，则认定所述单元格中的数据点为孤立点；

否则，逐个判断所述单元格中的数据点是否为孤立点。

可以理解的是，若所述第一数据点数目与所述第二数据点数目的和大于第二预设阈值，则说明以所述单元格为中心的较小范围内，包含有大量的数据点，从而说明所述单元格中的数据点不是孤立点，所述单元格中的数据点对应的周期性支付费用未超过所述第一预设阈值。若所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目的和不大于所述第二预设阈值，则说明以所述单元格为中心的较大范围内，包含较少的数据点，从而说明所述单元格中的数据点是孤立点，所述单元格中的数据点对应的周期性支付费用超过所述第一预设阈值。若所述第一数据点数目与所述第二数据点数目的和不大于所述第二预设阈值，且所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目的和大于所述第二预设阈值，则说明不能准确地认定所述单元格中的数据点是否为孤立点，此时，将所述单元格中的数据点作为待定数据点，并采用基于距离的算法逐个判断所述单元格中的数据点是否为孤立点。

在第二实施例中，根据第一预设阈值确定单元格边长，根据所述单元格边长将所述周期性支付费用所处的数据空间划分为若干单元格，并将所述周期性支付费用映射为所述单元格中的数据点，判断所述单元格中的数据点是否为孤立点，若所述单元格中的数据点为孤立点，则认定所述孤立点对应的周期性支付费用超过所述第一预设阈值。由于通过第一预设阈值确定了所述单元格边长，则基于所述单元格边长检测出的孤立点，是相对于所述第一预设阈值的孤立点，从而可根据检测出的孤立点判断对应的周期性支付费用是否超过第一预设阈值，督促医院合理收费，保障患者的利益。

参照图4，图4为本申请基于大数据的支付超量识别方法第三实施例的流程示意图，基于上述图3所示的第二实施例，提出本申请基于大数据的支付超量识别方法的第三实施例。

在第二实施例中，所述步骤S10，具体包括：

步骤S101：获取患者的抗排异支付数据，并对所述抗排异支付数据进行分词处理，生成词语序列。

步骤S102：将所述词语序列中的词语转化为词向量，生成对应的词向量序列。

可以理解的是，为了实现对所述抗排异支付数据的标准化，需将所述抗排异支付数据转化为计算机可以识别的周期性支付费用，比如向量，在本实施例中，对所述抗排异支付数据进行分词处理，生成词语序列，所述词语序列包含所述抗排异支付数据的每个词语与词语的序列。将所述词语序列中的词语转化为词向量，结合所述词语的序列，可获得词向量序列，所述词向量包含所述抗排异支付数据的词向量与词向量的序列。

步骤S103：根据预设双向递归神经网络模型将所述词向量序列编码为句子矩阵。

需要说明的是，所述预设双向递归神经网络(Bidirectional recurrent neural network，BRNN)模型是一种具有反馈结构的神经网络模型，将所述词向量输入至所述预设双向递归神经网络模型中，以使所述预设双向递归神经网络模型对所述词向量序列进行编码，并输出句子矩阵，所述句子矩阵的每一行表示每个词语在上下文中所表达的意思。

步骤S104：通过预设注意力模型将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。

可以理解的是，注意力模型(Attention model)用于从众多信息中选择出对当前任务目标更关键的信息，而所述预设注意力模型用于从所述句子矩阵中提取有效数据，并将所述有效数据转化为句向量。

进一步地，在第三实施例中，所述步骤S103，包括：

将所述词向量序列依次先正向后反向输入到预设双向递归神经网络模型中，以使所述预设双向递归神经网络模型对所述词向量序列进行编码，并输出句子矩阵。

需要说明的是，将所述词向量序列依次正向和反向输入到所述预设双向递归神经网络模型中，其中，正向输入是指将所述词向量序列中的词向量，按照位置的前后顺序依次输入对应时刻的预设双向递归神经网络模型中，所述反向输入是指将所述词向量序列中的词向量倒序依次输入对应时刻的预设双向递归神经网络模型，所述预设双向递归神经网络模型每个当前时刻的输入信号还包括上一时刻所述预设双向递归神经网络模型的输出信号，正向和反向信息输入都结束后，停止递归，输出句子矩阵。

进一步地，在第三实施例中，所述步骤S104，包括：

通过预设注意力模型从所述句子矩阵中提取上下文向量；

根据所述上下文向量将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。

可以理解的是，所述上下文向量表达了词向量之间的上下文关系，通过所述预设注意力模型从所述句子矩阵中提取上下文向量，根据所述上下文向量将所述句子矩阵压缩为句向量，能够提高句向量的准确性与全面性，从而获得准确的标准化支付数据。

在第三实施例中，对所述抗排异支付数据进行分词处理，生成词语序列，将所述词语序列中的词语转化为词向量，生成对应的词向量序列，根据预设双向递归神经网络模型将所述词向量序列编码为句子矩阵，通过预设注意力模型将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。由于依赖上下文向量，提高了生成标准化支付数据的效率和准确率。

此外，本申请实施例还提出一种存储介质，所述存储介质可以为非易失性可读存储介质。

本申请所述存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上文所述的基于大数据的支付超量识别方法的步骤。

其中，该计算机可读指令被执行时所实现的方法可参照本申请基于大数据的支付超量识别方法的各个实施例，此处不再赘述。

此外，参照图5，本申请实施例还提出一种基于大数据的支付超量识别装置，所述基于大数据的支付超量识别装置包括：

处理模块10，用于获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据。

需要说明的是，本实施例的应用场景是，患者在医院治疗时刷医保卡即时结算诊疗费用，医保卡就会记录患者的抗排异支付数据，所述抗排异支付数据包括收费时间、药物名称及收费金额等，并将该抗排异支付数据上传至人社核心***，每隔固定时间，例如，一年，用户将使用所述用户设备对患者的抗排异支付数据进行异常挖掘，判断一段时间(比如一个月)的抗排异支付数据对应的支付金额是否超过阈值，从而避免门诊不合理的收费情形，保障患者的利益。所述人社核心***记载的抗排异支付数据一般为不规范的文本信息，为了方便地判断支付费用是否超量，将预先对所述抗排异支付数据进行标准化处理，将所述抗排异支付数据转化为计算机能够识别的标准化支付数据。

统计模块20，用于根据所述标准化支付数据统计所述患者的周期性支付费用。

挖掘模块30，用于通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。

在本实施例中，通过获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据，根据所述标准化支付数据统计所述患者的周期性支付费用，通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。由于对患者的抗排异支付数据进行标准化与统计，获得了周期性支付费用，从而能够根据预设基于单元的孤立点检测算法准确地判断周期性支付费用是否超量，从而督促医院合理收费，保障患者的利益。

在一实施例中，所述挖掘模块30，还用于根据第一预设阈值确定单元格边长，根据所述单元格边长将所述周期性支付费用所处的数据空间划分为若干单元格，并将所述周期性支付费用映射为所述单元格中的数据点；

判断所述单元格中的数据点是否为孤立点；

在一实施例中，所述挖掘模块30，还用于遍历各单元格，统计各单元格中的第一数据点数目、各单元格的第一层邻居中的第二数据点数目以及各单元格的第二层邻居中的第三数据点数目；

根据所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目判断所述单元格中的数据点是否为孤立点。

在一实施例中，所述挖掘模块30，还用于若所述第一数据点数目与所述第二数据点数目的和大于第二预设阈值，则认定所述单元格中的数据点不是孤立点；

否则，逐个判断所述单元格中的数据点是否为孤立点。

在一实施例中，所述处理模块10，还用于获取患者的抗排异支付数据，并对所述抗排异支付数据进行分词处理，生成词语序列；

将所述词语序列中的词语转化为词向量，生成对应的词向量序列；

根据预设双向递归神经网络模型将所述词向量序列编码为句子矩阵；

通过预设注意力模型将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。

在一实施例中，所述处理模块10，还用于将所述词向量序列依次先正向后反向输入到预设双向递归神经网络模型中，以使所述预设双向递归神经网络模型对所述词向量序列进行编码，并输出句子矩阵。

在一实施例中，所述处理模块10，还用于通过预设注意力模型从所述句子矩阵中提取上下文向量；

本申请所述基于大数据的支付超量识别装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序，可将这些词语解释为名称。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器镜像(Read Only Memory image，ROM)/随机存取存储器(Random Access Memory，RAM)、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种基于大数据的支付超量识别方法，其中，所述基于大数据的支付超量识别方法包括以下步骤：

获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据；

根据所述标准化支付数据统计所述患者的周期性支付费用；

通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。
如权利要求1所述的基于大数据的支付超量识别方法，其中，所述通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值，包括：

根据第一预设阈值确定单元格边长，根据所述单元格边长将所述周期性支付费用所处的数据空间划分为若干单元格，并将所述周期性支付费用映射为所述单元格中的数据点；

判断所述单元格中的数据点是否为孤立点；

若所述单元格中的数据点为孤立点，则认定所述孤立点对应的周期性支付费用超过所述第一预设阈值。
如权利要求2所述的基于大数据的支付超量识别方法，其中，所述判断所述单元格中的数据点是否为孤立点，包括：

遍历各单元格，统计各单元格中的第一数据点数目、各单元格的第一层邻居中的第二数据点数目以及各单元格的第二层邻居中的第三数据点数目；

根据所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目判断所述单元格中的数据点是否为孤立点。
如权利要求3所述的基于大数据的支付超量识别方法，其中，所述根据所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目判断所述单元格中的数据点是否为孤立点，包括：

若所述第一数据点数目与所述第二数据点数目的和大于第二预设阈值，则认定所述单元格中的数据点不是孤立点；

若所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目的和不大于所述第二预设阈值，则认定所述单元格中的数据点为孤立点；

否则，逐个判断所述单元格中的数据点是否为孤立点。
如权利要求1所述的基于大数据的支付超量识别方法，其中，所述获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据，包括：

获取患者的抗排异支付数据，并对所述抗排异支付数据进行分词处理，生成词语序列；

将所述词语序列中的词语转化为词向量，生成对应的词向量序列；

根据预设双向递归神经网络模型将所述词向量序列编码为句子矩阵；

通过预设注意力模型将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。
如权利要求5所述的基于大数据的支付超量识别方法，其中，所述根据预设双向递归神经网络模型将所述词向量序列编码为句子矩阵，包括：

将所述词向量序列依次先正向后反向输入到预设双向递归神经网络模型中，以使所述预设双向递归神经网络模型对所述词向量序列进行编码，并输出句子矩阵。
如权利要求6所述的基于大数据的支付超量识别方法，其中，所述通过预设注意力模型将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据，包括：

通过预设注意力模型从所述句子矩阵中提取上下文向量；

根据所述上下文向量将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。
一种用户设备，其中，所述用户设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述计算机可读指令配置为实现以下步骤：

获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据；

根据所述标准化支付数据统计所述患者的周期性支付费用；

通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。
如权利要求8所述的用户设备，其中，所述计算机可读指令还配置为实现以下步骤：

根据第一预设阈值确定单元格边长，根据所述单元格边长将所述周期性支付费用所处的数据空间划分为若干单元格，并将所述周期性支付费用映射为所述单元格中的数据点；

判断所述单元格中的数据点是否为孤立点；

若所述单元格中的数据点为孤立点，则认定所述孤立点对应的周期性支付费用超过所述第一预设阈值。
如权利要求9所述的用户设备，其中，所述计算机可读指令还配置为实现以下步骤：

遍历各单元格，统计各单元格中的第一数据点数目、各单元格的第一层邻居中的第二数据点数目以及各单元格的第二层邻居中的第三数据点数目；

根据所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目判断所述单元格中的数据点是否为孤立点。
如权利要求10所述的用户设备，其中，所述计算机可读指令还配置为实现以下步骤：

若所述第一数据点数目与所述第二数据点数目的和大于第二预设阈值，则认定所述单元格中的数据点不是孤立点；

若所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目的和不大于所述第二预设阈值，则认定所述单元格中的数据点为孤立点；

否则，逐个判断所述单元格中的数据点是否为孤立点。
如权利要求8所述的用户设备，其中，所述计算机可读指令还配置为实现以下步骤：

获取患者的抗排异支付数据，并对所述抗排异支付数据进行分词处理，生成词语序列；

将所述词语序列中的词语转化为词向量，生成对应的词向量序列；

根据预设双向递归神经网络模型将所述词向量序列编码为句子矩阵；

通过预设注意力模型将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。
如权利要求12所述的用户设备，其中，所述计算机可读指令还配置为实现以下步骤：

将所述词向量序列依次先正向后反向输入到预设双向递归神经网络模型中，以使所述预设双向递归神经网络模型对所述词向量序列进行编码，并输出句子矩阵。
如权利要求13所述的用户设备，其中，所述计算机可读指令还配置为实现以下步骤：

通过预设注意力模型从所述句子矩阵中提取上下文向量；

根据所述上下文向量将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。
一种存储介质，其中，所述存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如以下步骤：

获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据；

根据所述标准化支付数据统计所述患者的周期性支付费用；

通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。
如权利要求15所述的存储介质，其中，所述计算机可读指令还配置为实现以下步骤：

根据第一预设阈值确定单元格边长，根据所述单元格边长将所述周期性支付费用所处的数据空间划分为若干单元格，并将所述周期性支付费用映射为所述单元格中的数据点；

判断所述单元格中的数据点是否为孤立点；

若所述单元格中的数据点为孤立点，则认定所述孤立点对应的周期性支付费用超过所述第一预设阈值。
如权利要求16所述的存储介质，其中，所述计算机可读指令还配置为实现以下步骤：

遍历各单元格，统计各单元格中的第一数据点数目、各单元格的第一层邻居中的第二数据点数目以及各单元格的第二层邻居中的第三数据点数目；

根据所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目判断所述单元格中的数据点是否为孤立点。
如权利要求17所述的存储介质，其中，所述计算机可读指令还配置为实现以下步骤：

若所述第一数据点数目与所述第二数据点数目的和大于第二预设阈值，则认定所述单元格中的数据点不是孤立点；

若所述第一数据点数目、所述第二数据点数目以及所述第三数据点数目的和不大于所述第二预设阈值，则认定所述单元格中的数据点为孤立点；

否则，逐个判断所述单元格中的数据点是否为孤立点。
如权利要求15所述的存储介质，其中，所述计算机可读指令还配置为实现以下步骤：

获取患者的抗排异支付数据，并对所述抗排异支付数据进行分词处理，生成词语序列；

将所述词语序列中的词语转化为词向量，生成对应的词向量序列；

根据预设双向递归神经网络模型将所述词向量序列编码为句子矩阵；

通过预设注意力模型将所述句子矩阵压缩为句向量，并将所述句向量作为标准化支付数据。
一种基于大数据的支付超量识别装置，其中，所述基于大数据的支付超量识别装置包括：

处理模块，用于获取患者的抗排异支付数据，对所述抗排异支付数据进行标准化处理，获得标准化支付数据；

统计模块，用于根据所述标准化支付数据统计所述患者的周期性支付费用；

挖掘模块，用于通过预设基于单元的孤立点检测算法判断所述周期性支付费用是否超过第一预设阈值。