CN111401674B - 一种基于大数据的高企信息化管理*** - Google Patents

一种基于大数据的高企信息化管理*** Download PDF

Info

Publication number
CN111401674B
CN111401674B CN201911254807.7A CN201911254807A CN111401674B CN 111401674 B CN111401674 B CN 111401674B CN 201911254807 A CN201911254807 A CN 201911254807A CN 111401674 B CN111401674 B CN 111401674B
Authority
CN
China
Prior art keywords
data
information
enterprise
class
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911254807.7A
Other languages
English (en)
Other versions
CN111401674A (zh
Inventor
李福瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201911254807.7A priority Critical patent/CN111401674B/zh
Publication of CN111401674A publication Critical patent/CN111401674A/zh
Application granted granted Critical
Publication of CN111401674B publication Critical patent/CN111401674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于大数据的高企信息化管理***,包括信息终端、安全防护模块和信息管理中心,所述信息终端包括用户登录单元、信息查询单元和信息上传单元,所述安全防护模块用于对信息上传单元上传的企业信息中的异常信息进行过滤后传输至信息管理中心,所述信息管理中心包括项目信息存储单元、员工信息存储单元、财务信息存储单元和政策信息存储单元,信息管理中心按照接收到的企业信息的种类将所述企业信息存储于对应的存储单元中。有益效果:提供一种基于大数据的高企信息化管理***,将企业中各部门之间的资料结合在一个平台,为企业和个人提供企业信息查询功能,实现了企业各部门之间的信息共享和档案信息化,提高了企业管理的效率。

Description

一种基于大数据的高企信息化管理***
技术领域
本发明创造涉及大数据领域,具体涉及一种基于大数据的高企信息化管理***。
背景技术
随着信息化技术的迅速发展和信息社会的来临,各企业越来越重视信息化建设,对于企业而言,要想提高自身的影响力,就必须结合时代的发展需求,改进和完善企业的内部信息管理工作。信息技术的发展对企业内部控制及财务管理提出了更高的要求,企业应当紧跟时代的发展步伐,推动企业内部控制和财务管理的信息化建设,从而提高企业的竞争力。
发明内容
针对上述问题,本发明旨在提供一种基于大数据的高企信息化管理***。
本发明创造的目的通过以下技术方案实现:
一种基于大数据的高企信息化管理***,包括信息终端、安全防护模块和信息管理中心,所述信息终端包括用户登录单元、信息查询单元和信息上传单元,所述用户登录单元为用户提供登录该管理***的界面,用户在该登录界面通过输入用户名和密码进入该管理***,用户可以通过信息查询单元查询信息管理中心存储的企业信息,用户可以通过信息上传单元上传企业信息,所述安全防护模块用于对信息上传单元上传的企业信息中的异常信息进行过滤,将过滤后的企业信息传输至信息管理中心,所述信息管理中心包括项目信息存储单元、员工信息存储单元、财务信息存储单元和政策信息存储单元,信息管理中心按照接收到的企业信息的种类将所述企业信息存储于对应的存储单元中。
本发明创造的有益效果:提供一种基于大数据的高企信息化管理***,将企业中各部门之间的资料结合在一个平台,为企业和个人提供企业信息查询功能,实现了企业各部门之间的信息共享和档案信息化,提高了企业管理的效率,此外,在企业信息上传的过程中,对企业信息进行安全检测,确保了企业管理***的安全性。
附图说明
利用附图对发明创造作进一步说明,但附图中的实施例不构成对本发明创造的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明结构示意图。
附图标记:
信息终端1;安全防护模块2;信息管理中心3;用户登录单元11;信息查询单元12;信息上传单元13;信息处理单元21;信息分类单元22;安全检测单元23;项目信息存储单元31;员工信息存储单元32;财务信息存储单元33;政策信息存储单元34。
具体实施方式
结合以下实施例对本发明作进一步描述。
参见图1,本实施例的一种基于大数据的高企信息化管理***,包括信息终端1、安全防护模块2和信息管理中心3,所述信息终端1包括用户登录单元11、信息查询单元12和信息上传单元13,所述用户登录单元11为用户提供登录该管理***的界面,用户在该登录界面通过输入用户名和密码进入该管理***,用户可以通过信息查询单元12查询信息管理中心3存储的企业信息,用户可以通过信息上传单元13上传企业信息,所述安全防护模块2用于对信息上传单元13上传的企业信息中的异常信息进行过滤,将过滤后的企业信息传输至信息管理中心3,所述信息管理中心3包括项目信息存储单元31、员工信息存储单元32、财务信息存储单元33和政策信息存储单元34,信息管理中心3按照接收到的企业信息的种类将所述企业信息存储于对应的存储单元中。
本优选实施例提供一种基于大数据的高企信息化管理***,将企业中各部门之间的资料结合在一个平台,为企业和个人提供企业信息查询功能,实现了企业各部门之间的信息共享和档案信息化,提高了企业管理的效率。
优选地,所述安全防护模块2用于对信息上传单元13上传的企业信息中的异常信息进行过滤,包括信息处理单元21、信息分类单元22和安全检测单元23,所述信息处理单元21用于对上传的企业信息进行标准化处理,并对标准化处理后的企业信息进行降维,所述信息分类单元22用于对处理后的企业信息进行分类,所述安全检测单元23用于根据分类结果对上传的企业信息中的异常数据进行过滤。
优选地,所述信息分类单元22用于对处理后的企业信息进行分类,包括参数确定部分和数据分类部分,所述参数确定部分用于选取初始聚类中心,所述数据分类部分用于根据选取的初始聚类中心将企业信息进行分类。
本优选实施例在企业信息上传的过程中,对企业信息进行安全检测,确保了企业管理***的安全性。
优选地,所述参数确定部分用于选取聚类中心,设
Figure DEST_PATH_IMAGE002
表示待分类的数据集(其中,/>
Figure DEST_PATH_IMAGE004
表示数据集/>
Figure DEST_PATH_IMAGE006
中的数据量),定义数据集/>
Figure 442343DEST_PATH_IMAGE006
中数据/>
Figure DEST_PATH_IMAGE008
对应的竞争聚类中心的权值为/>
Figure DEST_PATH_IMAGE010
,则/>
Figure 174676DEST_PATH_IMAGE010
的计算公式为:
Figure DEST_PATH_IMAGE012
式中,
Figure 148317DEST_PATH_IMAGE008
为数据集/>
Figure 430656DEST_PATH_IMAGE006
中的第/>
Figure DEST_PATH_IMAGE014
个数据点,/>
Figure DEST_PATH_IMAGE016
为数据集/>
Figure 743826DEST_PATH_IMAGE006
中的第/>
Figure DEST_PATH_IMAGE018
个数据,/>
Figure DEST_PATH_IMAGE020
表示数据
Figure 443797DEST_PATH_IMAGE008
的邻域数据集合,/>
Figure DEST_PATH_IMAGE022
表示数据/>
Figure 809794DEST_PATH_IMAGE008
的邻域数据集合/>
Figure 394359DEST_PATH_IMAGE020
中的数据量,/>
Figure DEST_PATH_IMAGE024
为数值较小的正常数,/>
Figure DEST_PATH_IMAGE026
为数据/>
Figure 358773DEST_PATH_IMAGE008
的邻域数据集合/>
Figure 370592DEST_PATH_IMAGE020
中的数据,/>
Figure DEST_PATH_IMAGE028
为数据/>
Figure 226814DEST_PATH_IMAGE008
的邻域数据集合/>
Figure 615070DEST_PATH_IMAGE020
中的数据,且
Figure DEST_PATH_IMAGE030
在数据集
Figure 371674DEST_PATH_IMAGE006
中选取聚类中心,具体为:
step1:在计算每个数据对应的竞争聚类中心的权值后,选择具有最大权值的数据作为第一个聚类中心
Figure DEST_PATH_IMAGE032
,/>
Figure DEST_PATH_IMAGE034
为其对应的竞争聚类中心的权值;
step2:确定聚类中心后,对数据集
Figure 906124DEST_PATH_IMAGE006
中的每个数据对应的竞争聚类中心的权值进行修正,具体为:
Figure DEST_PATH_IMAGE036
式中,
Figure DEST_PATH_IMAGE038
是第/>
Figure DEST_PATH_IMAGE040
个聚类中心,/>
Figure DEST_PATH_IMAGE042
是聚类中心/>
Figure 403970DEST_PATH_IMAGE038
对应的竞争聚类中心的权值;
Step3:修正了数据集
Figure 831803DEST_PATH_IMAGE006
中各个数据的权值后,在修正后的权值中选取具有最大权值的数据点作为下一个聚类中心,当新的聚类中心满足/>
Figure DEST_PATH_IMAGE044
时(其中,/>
Figure DEST_PATH_IMAGE046
为设置的阈值),则算法结束,否则返回步骤Step2;
算法结束时得到的所有聚类中心即为初始聚类中心,记为
Figure DEST_PATH_IMAGE048
,/>
Figure DEST_PATH_IMAGE050
为得到的聚类中心数。
本优选实施例采用基于权值的竞争方式在数据集中选取初始聚类中心,在计算数据点对应的竞争聚类中心的权值公式中,综合考虑了该数据到数据集中其他数据的距离因素和该数据周围数据的分布特性,使得选取的聚类中心具有最高的数据密度,此外,构建的权值计算公式相较于传统聚类中采用的指数形式的计算方法,使得该聚类算法具有计算复杂度低和运行时间少的优点,在对高维数据进行聚类时,具有较好的聚类效果。
优选地,所述数据分类部分采用
Figure DEST_PATH_IMAGE052
聚类算法对处理后的企业信息进行聚类,将参数确定部分得到的聚类中心作为初始聚类中心,获得的聚类中心的个数/>
Figure 98705DEST_PATH_IMAGE050
作为
Figure 747599DEST_PATH_IMAGE052
聚类算法的最大类别数/>
Figure DEST_PATH_IMAGE054
,在所述/>
Figure 873686DEST_PATH_IMAGE052
聚类算法中提出一种新的聚类有效性指标/>
Figure DEST_PATH_IMAGE056
,设数据集/>
Figure 869324DEST_PATH_IMAGE006
被划分为/>
Figure DEST_PATH_IMAGE058
个类/>
Figure DEST_PATH_IMAGE060
,则聚类有效性指标/>
Figure 367564DEST_PATH_IMAGE056
的表达式为:
Figure DEST_PATH_IMAGE062
式中,
Figure 282299DEST_PATH_IMAGE004
表示待分类的数据集/>
Figure 567787DEST_PATH_IMAGE006
中的数据量,/>
Figure DEST_PATH_IMAGE064
表示类/>
Figure DEST_PATH_IMAGE066
中的第/>
Figure DEST_PATH_IMAGE068
个数据,/>
Figure DEST_PATH_IMAGE070
表示类/>
Figure DEST_PATH_IMAGE072
中的第/>
Figure 527303DEST_PATH_IMAGE014
个数据,/>
Figure DEST_PATH_IMAGE074
表示类/>
Figure 411207DEST_PATH_IMAGE066
中的数据量,/>
Figure DEST_PATH_IMAGE076
表示类/>
Figure 903368DEST_PATH_IMAGE072
的第/>
Figure DEST_PATH_IMAGE078
个数据,/>
Figure DEST_PATH_IMAGE080
表示类/>
Figure 4048DEST_PATH_IMAGE072
中的数据量;
聚类有效性指标
Figure 574445DEST_PATH_IMAGE056
的值越大,代表聚类效果越好。
本优选实施例将参数确定部分得到的聚类中心作为
Figure 749074DEST_PATH_IMAGE052
聚类算法的初始聚类中心,解决了/>
Figure 349820DEST_PATH_IMAGE052
聚类算法对初始聚类中心敏感的问题,提高了聚类结果的准确性;在/>
Figure 609900DEST_PATH_IMAGE052
聚类算法中提出一种新的聚类有效性指标/>
Figure 219873DEST_PATH_IMAGE056
,传统的聚类有效性指标都以数据到类的聚类中心的距离作为衡量类内距离和类间聚类的参考,而本优选实施例提出的聚类有效性指标/>
Figure 45746DEST_PATH_IMAGE056
在衡量类内距离,以数据到其所在类中其他数据的距离均值作为参考,在衡量类间距离时,以数据到其他类中数据的距离平均距离的最小值作为参考,能够更加准确的反应数据和其他数据之间的结构关系,从而提高了聚类结果的准确性。
优选地,所述安全检测单元23用于根据数据分类部分的分类结果对企业信息中的异常信息进行过滤,设数据分类部分最终将处理后的企业信息划分为
Figure DEST_PATH_IMAGE082
个类,将划分的
Figure 115596DEST_PATH_IMAGE082
个类按照类中数据量由多到少进行排序组成集合/>
Figure DEST_PATH_IMAGE084
,且集合/>
Figure DEST_PATH_IMAGE086
,当集合/>
Figure 456447DEST_PATH_IMAGE084
中的类满足/>
Figure DEST_PATH_IMAGE088
且/>
Figure DEST_PATH_IMAGE090
时(其中,/>
Figure DEST_PATH_IMAGE092
为设置的第一阈值,/>
Figure DEST_PATH_IMAGE094
为设置的第二阈值,/>
Figure DEST_PATH_IMAGE096
为类/>
Figure DEST_PATH_IMAGE098
中的数据量,/>
Figure DEST_PATH_IMAGE100
为类/>
Figure DEST_PATH_IMAGE102
中的数据量,/>
Figure DEST_PATH_IMAGE104
为类/>
Figure DEST_PATH_IMAGE106
中的数据量,/>
Figure DEST_PATH_IMAGE108
为类/>
Figure DEST_PATH_IMAGE110
中的数据量,/>
Figure DEST_PATH_IMAGE112
为集合的分界值),根据获得的分界值/>
Figure 855066DEST_PATH_IMAGE112
将集合/>
Figure 738708DEST_PATH_IMAGE084
划分为子集合/>
Figure DEST_PATH_IMAGE114
和子集合/>
Figure DEST_PATH_IMAGE116
,且子集合/>
Figure DEST_PATH_IMAGE118
,子集合/>
Figure DEST_PATH_IMAGE120
,定义检测系数/>
Figure DEST_PATH_IMAGE122
,设/>
Figure DEST_PATH_IMAGE124
为数据集/>
Figure 163480DEST_PATH_IMAGE006
中的任一数据点,则数据/>
Figure 132573DEST_PATH_IMAGE124
对应的检测系数/>
Figure DEST_PATH_IMAGE126
为:
当数据
Figure 913709DEST_PATH_IMAGE124
满足/>
Figure DEST_PATH_IMAGE128
时,则定义数据/>
Figure 183017DEST_PATH_IMAGE124
对应的检测系数
Figure DEST_PATH_IMAGE130
,其中,/>
Figure DEST_PATH_IMAGE132
表示类/>
Figure 624362DEST_PATH_IMAGE102
的聚类中心,/>
Figure DEST_PATH_IMAGE134
表示类/>
Figure 913042DEST_PATH_IMAGE102
中的数据量,/>
Figure DEST_PATH_IMAGE136
为类/>
Figure 199667DEST_PATH_IMAGE102
中的数据;
当数据
Figure 792322DEST_PATH_IMAGE124
满足/>
Figure DEST_PATH_IMAGE138
时,则定义数据/>
Figure 935728DEST_PATH_IMAGE124
对应的检测系数
Figure DEST_PATH_IMAGE140
,其中,/>
Figure 912036DEST_PATH_IMAGE132
为类/>
Figure 205614DEST_PATH_IMAGE102
的聚类中心,类/>
Figure 652776DEST_PATH_IMAGE102
为集合/>
Figure 639187DEST_PATH_IMAGE114
中类的聚类中心离数据/>
Figure 70168DEST_PATH_IMAGE124
距离最小的类,/>
Figure 964175DEST_PATH_IMAGE096
为类/>
Figure 764378DEST_PATH_IMAGE098
中的数据量,/>
Figure 921690DEST_PATH_IMAGE136
为类/>
Figure 839968DEST_PATH_IMAGE098
中的数据;
根据上述定义的检测系数的计算公式计算数据集
Figure 272086DEST_PATH_IMAGE006
中各数据对应的检测系数
Figure DEST_PATH_IMAGE142
(其中,/>
Figure 224998DEST_PATH_IMAGE004
为数据集/>
Figure 553212DEST_PATH_IMAGE006
中的数据量),将计算所得的各数据的检测系数按由大到小进行排序,选取前/>
Figure DEST_PATH_IMAGE144
个数据作为异常数据进行删除,其中,/>
Figure DEST_PATH_IMAGE146
本优选实施例定义检测系数对数据集
Figure 788146DEST_PATH_IMAGE006
中的异常数据进行检测,根据各个类中的数据量将分类得到的类集合/>
Figure 492797DEST_PATH_IMAGE084
划分为两个子集合,对两个子集合中的数据分别定义不同的检测系数/>
Figure 34637DEST_PATH_IMAGE122
,能够有效的避免当异常数据被分配到数据量较多的类中而被认为是正常数据的缺陷,此外,在对两个子集合设置检测系数时,综合考虑了数据点和聚类中心之间的距离以及数据点所在类的数据量,保证了距离相等时,数据量较少的类中的数据比数据量较多的类中的数据的检测系数大,从而保证了异常数据的有效检测。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (3)

1.一种基于大数据的高企信息化管理***,其特征是,包括信息终端、安全防护模块和信息管理中心,所述信息终端包括用户登录单元、信息查询单元和信息上传单元,所述用户登录单元为用户提供登录该管理***的界面,用户在该登录界面通过输入用户名和密码进入该管理***,用户可以通过信息查询单元查询信息管理中心存储的企业信息,用户可以通过信息上传单元上传企业信息,所述安全防护模块用于对信息上传单元上传的企业信息中的异常信息进行过滤,将过滤后的企业信息传输至信息管理中心,所述信息管理中心包括项目信息存储单元、员工信息存储单元、财务信息存储单元和政策信息存储单元,信息管理中心按照接收到的企业信息的种类将所述企业信息存储于对应的存储单元中;
所述安全防护模块用于对信息上传单元上传的企业信息中的异常信息进行过滤,包括信息处理单元、信息分类单元和安全检测单元,所述信息处理单元用于对上传的企业信息进行标准化处理,并对标准化处理后的企业信息进行降维,所述信息分类单元用于对处理后的企业信息进行分类,所述安全检测单元用于根据分类结果对上传的企业信息中的异常信息进行过滤;
所述信息分类单元用于对处理后的企业信息进行聚类,包括参数确定部分和数据分类部分,所述参数确定部分用于选取初始聚类中心,所述数据分类部分用于根据确定的初始聚类中心将企业信息进行分类;
所述参数确定部分用于选取初始聚类中心,设d={x1,x2,…,xN}表示待分类的数据集,其中,N表示数据集D中的数据量,定义数据集D中数据xi对应的竞争聚类中心的权值为W1(xi),则W1(xi)的计算公式为:
Figure FDA0004238205780000011
式中,xi为数据集D中的第i个数据,xj为数据集D中的第j个数据,Si表示数据xi的邻域数据集合,|Si|表示数据xi的邻域数据集合Si中的数据量,δ为数值较小的正常数,xm为数据xi的邻域数据集合Si中的数据,xn为数据xi的邻域数据集合Si中的数据,且xm≠xn
在数据集D中选取聚类中心,具体为:
step1:在计算每个数据对应的竞争聚类中心的权值后,选择具有最大权值的数据作为第一个聚类中心x1,W1(x1)为其对应的竞争聚类中心的权值;
step2:确定聚类中心后,对数据集D中的每个数据对应的竞争聚类中心的权值进行修正,具体为:
Figure FDA0004238205780000021
式中,xt-1是第(t-1)个聚类中心,Wt-1(xt-1)是聚类中心xt-1对应的竞争聚类中心的权值;
Step3:修正了数据集D中各个数据的权值后,在修正后的权值中选取具有最大权值的数据作为下一个聚类中心,当新的聚类中心满足Wt(xt)-W1(x1)<γ时,则算法结束,否则返回步骤Step2,其中,γ为设置的阈值;
算法结束时得到的所有聚类中心即为初始聚类中心,记为V={vu,u=1,2,…,C},C为得到的聚类中心数。
2.根据权利要求1所述的一种基于大数据的高企信息化管理***,其特征是,所述数据分类部分采用K-means聚类算法对处理后的企业信息进行聚类,将参数确定部分得到的聚类中心作为初始聚类中心,获得的聚类中心的个数C作为K-means聚类算法的最大类别数cmax,在所述K-means聚类算法中提出一种新的聚类有效性指标J,设数据集D被划分为c个类{l1,l2,…,lc},则聚类有效性指标j的表达式为:
Figure FDA0004238205780000022
式中,N表示待分类的数据集D中的数据量,
Figure FDA0004238205780000023
表示类lk中的第n个数据,/>
Figure FDA0004238205780000024
表示类lj中的第i个数据,|lk|表示类lk中的数据量,/>
Figure FDA0004238205780000025
表示类lj的第q个数据,|lj|表示类lj中的数据量。
3.根据权利要求2所述的一种基于大数据的高企信息化管理***,其特征是,所述安全检测单元用于根据数据分类部分的分类结果对企业信息中的异常信息进行过滤,设数据分类部分最终将处理后的企业信息划分为copt个类,将划分的copt个类按照类中数据量由多到少进行排序组成集合L,且集合L={Li,i=1,2,…,copt},当集合L中的类满足
Figure FDA0004238205780000031
且/>
Figure FDA0004238205780000032
时,根据此时的d值将集合L划分为子集合B和子集合S,且子集合B={L1,L2,…,Ld},子集合/>
Figure FDA0004238205780000033
其中,T1为设置的第一阈值,T2为设置的第二阈值,|Li|为类Li中的数据量,|Lj|为类Lj中的数据量,|Ld|为类Ld中的数据量,|Ld+1|为类Ld+1中的数据量,d为集合的分界值;
定义检测系数Z,设xk为数据集D中的任一数据点,则数据xk对应的检测系数Z(xk)为:
当数据xk满足{(xk∈Lj)∩(Lj∈B)}时,则定义数据xk对应的检测系数
Figure FDA0004238205780000034
其中,vj表示类Lj的聚类中心,|Lj|表示类Lj中的数据量,xt为类Lj中的数据;
当数据xk满足{(xk∈Li)∩(Li∈S)}时,则定义数据xk对应的检测系数
Figure FDA0004238205780000035
其中,vj为类Lj的聚类中心,类Lj为集合B中类的聚类中心离数据xk距离最小的类,|Li|为类Li中的数据量,xt为类Li中的数据;
根据上述定义的检测系数的计算公式计算数据集D中各数据对应的检测系数Z(xk),k=1,2,…,N,其中,N为数据集D中的数据量,将计算所得的各数据的检测系数按由大到小进行排序,选取前p个数据作为异常数据进行删除,其中,
Figure FDA0004238205780000036
CN201911254807.7A 2019-12-10 2019-12-10 一种基于大数据的高企信息化管理*** Active CN111401674B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911254807.7A CN111401674B (zh) 2019-12-10 2019-12-10 一种基于大数据的高企信息化管理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911254807.7A CN111401674B (zh) 2019-12-10 2019-12-10 一种基于大数据的高企信息化管理***

Publications (2)

Publication Number Publication Date
CN111401674A CN111401674A (zh) 2020-07-10
CN111401674B true CN111401674B (zh) 2023-06-23

Family

ID=71428328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911254807.7A Active CN111401674B (zh) 2019-12-10 2019-12-10 一种基于大数据的高企信息化管理***

Country Status (1)

Country Link
CN (1) CN111401674B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577792A (zh) * 2017-09-18 2018-01-12 前海梧桐(深圳)数据有限公司 一种企业数据自动聚类的方法及其***
CN107786648A (zh) * 2017-10-17 2018-03-09 湖南指尖聚赢网络科技股份有限公司 一种企业服务管理云平台
CN109359817A (zh) * 2018-09-13 2019-02-19 江苏站企动网络科技有限公司 一种企业信息分析管理***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156791B (zh) * 2016-06-15 2021-03-30 北京京东尚科信息技术有限公司 业务数据分类方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577792A (zh) * 2017-09-18 2018-01-12 前海梧桐(深圳)数据有限公司 一种企业数据自动聚类的方法及其***
CN107786648A (zh) * 2017-10-17 2018-03-09 湖南指尖聚赢网络科技股份有限公司 一种企业服务管理云平台
CN109359817A (zh) * 2018-09-13 2019-02-19 江苏站企动网络科技有限公司 一种企业信息分析管理***

Also Published As

Publication number Publication date
CN111401674A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN108427669B (zh) 异常行为监控方法和***
CN107633030B (zh) 基于数据模型的信用评估方法及装置
CN111324642A (zh) 一种面向电网大数据分析的模型算法选型与评价方法
US20070005556A1 (en) Probabilistic techniques for detecting duplicate tuples
WO2020220758A1 (zh) 一种异常交易节点的检测方法及装置
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN109783879B (zh) 一种雷达辐射源信号识别效能评估方法及***
CN111079941B (zh) 信用信息处理方法、***、终端和存储介质
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN111008726B (zh) 一种电力负荷预测中类图片转换方法
CN113987033B (zh) 主变在线监测数据群体偏差识别与校准方法
CN107679734A (zh) 一种用于无标签数据分类预测的方法和***
CN112365060B (zh) 电网物联感知数据的预处理方法
WO2018006631A1 (zh) 一种用户等级自动划分方法及***
CN115712846A (zh) 网络流量异常检测方法及装置、终端设备、可读存储介质
CN115718861A (zh) 高耗能行业中用电用户的分类与异常行为监测方法及***
CN115982132A (zh) 一种外销扇面图像数据样本库构建***
CN111401674B (zh) 一种基于大数据的高企信息化管理***
CN108090635B (zh) 一种基于聚类分类的路用性能预测方法
CN111625578B (zh) 适用于文化科技融合领域时间序列数据的特征提取方法
CN113392877A (zh) 一种基于蚁群算法与c-k算法的日负荷曲线聚类方法
Wang et al. A Novel Multi‐Input AlexNet Prediction Model for Oil and Gas Production
CN109063944A (zh) 基于大数据分析技术的城市金融指数分析方法及装置
CN115017988A (zh) 一种用于状态异常诊断的竞争聚类方法
CN114495137A (zh) 票据异常检测模型生成方法与票据异常检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant