CN109740820A - 一种项目过程管理预测数据的排异方法 - Google Patents

一种项目过程管理预测数据的排异方法 Download PDF

Info

Publication number
CN109740820A
CN109740820A CN201910031283.9A CN201910031283A CN109740820A CN 109740820 A CN109740820 A CN 109740820A CN 201910031283 A CN201910031283 A CN 201910031283A CN 109740820 A CN109740820 A CN 109740820A
Authority
CN
China
Prior art keywords
data
distribution
value
follows
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910031283.9A
Other languages
English (en)
Inventor
唐雪飞
张青龙
岳超
胡茂秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU COMSYS INFORMATION TECHNOLOGY Co Ltd
Original Assignee
CHENGDU COMSYS INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU COMSYS INFORMATION TECHNOLOGY Co Ltd filed Critical CHENGDU COMSYS INFORMATION TECHNOLOGY Co Ltd
Priority to CN201910031283.9A priority Critical patent/CN109740820A/zh
Publication of CN109740820A publication Critical patent/CN109740820A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Stored Programmes (AREA)

Abstract

一种项目过程管理预测数据的排异方法,包括以下步骤:S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除。通过预测数据的排异算法提高了检测数据的合理性和有效性,为项目管理阶段做了相应的数据支持,使项目管理者获得的阶段信息更加真实可靠,为项目成功奠定了基础。

Description

一种项目过程管理预测数据的排异方法
技术领域
本发明涉及一种项目过程管理预测数据的排异方法。
背景技术
近些年可谓是新科技快速发展的阶段,诸如人工智能、机器学习、物联网以及自动化新型技术的演进。软件技术被认为是促进各项业务增长的催化剂,软件产品是否能按照预期的成本、进度、质量顺利的完成被越来越多的企业重点关注。软件产品能否顺利交付的基础就是项目管理,它涵盖项目工作范围、过程风险、项目资源、任务目标、经历的里程碑、过程工作量、进度等,管理目的是让整个项目从分析、设计、编码、测试、维护等全部生命周期都能在管理者的控制下,以预期投入的成本,按质的交付给用户使用。然而在软件项目管理过程中如计划的制定、项目进度控制、***、资源人投入、问题分析等重要环节又不可或缺相应的数据分析,怎样从大量预测数据中筛选出有价值且正确数据显得尤为重要,这项工作的好坏直接决定了整个软件项目开发的成败,介于此我们引进了一种数据排异算法,将测量数据中异常或可能造成预测结果偏差的数据进行排除,最终使得预测更真实准确便于管理者决策,达到项目管理的目的。
软件开发过程中如果对过程数据分析不彻底不准确造成了判断的失误,都是潜在的风险源,它可能引导项目一步一步走向失败,同样如果过程把控好数据分析精准,软件项目就会随着设计思路迈向成功。
数据分析过程中,异常数据的出现会直接导致分析结果发生显著的变化造成得到的结果超出预期,从而使管理者对整个项目过程的推断、控制和预测不准确出现错误的判断,给整个项目的顺利完成带来了风险,因此有效的检测、排查、防治数据异常有着很重要的作用。
发明内容
本发明的目的在于克服现有技术的不足,提供一种通过预测数据的排异算法提高了检测数据的合理性和有效性,为项目管理阶段做了相应的数据支持,能够使项目管理者获得的阶段信息更加真实可靠的项目过程管理预测数据的排异方法。
本发明的目的是通过以下技术方案来实现的:一种项目过程管理预测数据的排异方法,包括以下步骤:
S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;
S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;
S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除。
进一步地,所述步骤S1具体实现方法为:定义预测数据的属性变量为X,它服从某种数据分布形式f(x),表达式为:
X~f(x)
运用统计学知识,计算样本数据y=(a11,a21,a31,…am1)r的频率分布fP(x),并对其均值μ、方差进行σ估计,具体表达式如下:
进一步地,所述步骤S2具体实现方法为:采用概率分布结构相似的方法,确定属性值的概率分布f(x);
K个概率密度函数的分布律为gk(x)和gk(n);
正态分布为:
分布的相似度计算公式为:
利用不等式,得出:0≤Sh≤1,k∈(1,2,3…,N);N为概率密度函数或分布律的个数;当fp(x)=h·gk(x)或fp(n)=h·gk(n)时,Sk=1;h为比例系数;
若最大的相似度则近似认为:
进一步地,所述步骤S3具体实现方法为:从极值处开始,对每个数据的属性值分布函数的最大值和最小值进行判断:
其中,R为预设的门限阈值,当某数据的属性值分布函数的最大值和最小值同时满足上述两个不等式时则将该数据判断为异常数据,将该异常数据剔除,并继续判断剩余数据。
本发明的有益效果是:本发明提供了一种项目过程管理预测数据的排异方法,通过预测数据的排异算法提高了检测数据的合理性和有效性,为项目管理阶段做了相应的数据支持,使项目管理者获得的阶段信息更加真实可靠,为项目成功奠定了基础。
附图说明
图1为本发明的项目过程管理预测数据的排异方法的流程图。
具体实施方式
异常数据的定义:异常就是预测数据集中偏离了大部分数据的那部分数据。异常数据与同一数据集中其他数据的行为和模型都不一致。
异常数据排异方法针对单一属性的样本数据进行排异,单一数据的样本属性的结构形式为:假设大量数据集在一起形成了一个样本矩阵。样本中的单一行是一个数据对象,不同数据对象所表示的不同物质等,每一列数据样本对象代表了一个属性特征,属性值指描述数据特征的数据值。如对象个数为m属性个数为n,数据集样本的矩阵为m*n,其中i对象的第个j属性值为aij,样本矩阵y表达式为:
n=1则此样本数据为单属性,n>1时是多属性。
单属性样本数据n=1,则样本矩阵即为样本向量y,其数据结构为:
y=(a11,a21,a31,…am1)r
下面结合附图进一步说明本发明的技术方案。
如图1所示,一种项目过程管理预测数据的排异方法,包括以下步骤:
S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;
具体实现方法为:假定预测数据符合某种分布如:正态分布;从测试数据中抽取符合正态分布的数据作为样本;
定义预测数据的属性变量为X,它服从某种数据分布形式f(x),表达式为:
X~f(x)
运用统计学知识,计算样本数据y=(a11,a21,a31,…am1)r的频率分布fP(x),并对其均值μ、方差进行σ估计,具体表达式如下:
S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;具体实现方法为:采用概率分布结构相似的方法,确定属性值的概率分布f(x);
K个概率密度函数的分布律为gk(x)和gk(n);
正态分布为:
分布的相似度计算公式为:
利用不等式,得出:0≤Sh≤1,k∈(1,2,3…,N);N为概率密度函数或分布律的个数;当fp(x)=h·gk(x)或fp(n)=h·gk(n)时,Sk=1;h为比例系数;
若最大的相似度则近似认为:
S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除;具体实现方法为:从极值处开始,对每个数据的属性值分布函数的最大值和最小值进行判断:
其中,R为预设的门限阈值,当某数据的属性值分布函数的最大值和最小值同时满足上述两个不等式时则将该数据判断为异常数据,将该异常数据剔除,并继续判断剩余数据。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (4)

1.一种项目过程管理预测数据的排异方法,其特征在于,包括以下步骤:
S1、确定数据的分布特性,参照已有的样本数据对预测数据的均值、方差进行评估;
S2、采用假设检验的方法计算预测数据精确的近似概率分布模型;
S3、定义置信概率并确定置信门限阈值,根据置信门限阀值来判断预测数据是否异常,找出异常数据并剔除。
2.根据权利要求1所述的一种项目过程管理预测数据的排异方法,其特征在于,所述步骤S1具体实现方法为:定义预测数据的属性变量为X,它服从某种数据分布形式f(x),表达式为:
X~f(x)
运用统计学知识,计算样本数据y=(a11,a21,a31,…am1)r的频率分布fP(x),并对其均值μ、方差进行σ估计,具体表达式如下:
3.根据权利要求1所述的一种项目过程管理预测数据的排异方法,其特征在于,所述步骤S2具体实现方法为:采用概率分布结构相似的方法,确定属性值的概率分布f(x);
设定第K个概率密度函数、分布律分别为gk(x)和gk(n);
正态分布为:
分布的相似度计算公式为:
利用不等式,得出:0≤Sk≤1,k∈(1,2,3…,N);N为概率密度函数或分布律的个数;当fp(x)=h·gk(x)或fp(n)=h·gk(n)时,Sk=1;h为比例系数;
若最大的相似度则近似认为:
4.根据权利要求1所述的一种项目过程管理预测数据的排异方法,其特征在于,所述步骤S3具体实现方法为:从极值处开始,对每个数据的属性值分布函数的最大值和最小值进行判断:
其中,R为预设的门限阈值,当某数据的属性值分布函数的最大值和最小值同时满足上述两个不等式时则将该数据判断为异常数据,将该异常数据剔除,并继续判断剩余数据。
CN201910031283.9A 2019-01-14 2019-01-14 一种项目过程管理预测数据的排异方法 Pending CN109740820A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910031283.9A CN109740820A (zh) 2019-01-14 2019-01-14 一种项目过程管理预测数据的排异方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910031283.9A CN109740820A (zh) 2019-01-14 2019-01-14 一种项目过程管理预测数据的排异方法

Publications (1)

Publication Number Publication Date
CN109740820A true CN109740820A (zh) 2019-05-10

Family

ID=66364655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910031283.9A Pending CN109740820A (zh) 2019-01-14 2019-01-14 一种项目过程管理预测数据的排异方法

Country Status (1)

Country Link
CN (1) CN109740820A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231475A (zh) * 2020-10-14 2021-01-15 宁夏回族自治区教育信息化管理中心 一种基于动态分布函数的数据检测预警方法
CN113158497A (zh) * 2021-05-26 2021-07-23 中国平安人寿保险股份有限公司 在线服务实验方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231475A (zh) * 2020-10-14 2021-01-15 宁夏回族自治区教育信息化管理中心 一种基于动态分布函数的数据检测预警方法
CN113158497A (zh) * 2021-05-26 2021-07-23 中国平安人寿保险股份有限公司 在线服务实验方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN106201871B (zh) 基于代价敏感半监督的软件缺陷预测方法
Chen et al. A risk-averse remaining useful life estimation for predictive maintenance
Song et al. Active learning with confidence-based answers for crowdsourcing labeling tasks
CN108647707B (zh) 概率神经网络创建方法、故障诊断方法及装置、存储介质
CN105786711A (zh) 一种数据分析的方法及装置
EP3596670A1 (en) Automated decision making using staged machine learning
Kumar Measuring Software reusability using SVM based classifier approach
CN109711707B (zh) 一种船舶动力装置综合状态评估方法
CN109740820A (zh) 一种项目过程管理预测数据的排异方法
Maliah et al. MDP-based cost sensitive classification using decision trees
CN110458600A (zh) 画像模型训练方法、装置、计算机设备及存储介质
CN107391452A (zh) 一种基于数据欠采样和集成学习的软件缺陷数目预测方法
Shi et al. Developing an Evaluation Approach for Software Trustworthiness Using Combination Weights and TOPSIS.
Ilkhani et al. Extraction test cases by using data mining; reducing the cost of testing
Baras et al. Automatic boosting of cross-product coverage using Bayesian networks
Daraghmeh et al. Incorporating data preparation and clustering techniques for workload segmentation in large-scale cloud data centers
Tandon et al. An empirical analysis of code smells using CRITIC-TOPSIS method
Groth A framework for using SACADA to enhance the qualitative and quantitative basis of HRA
CN110020147A (zh) 模型生成、评论识别的方法、***、设备及存储介质
Nurajijah et al. Gradient Tree Boosting for HR Talent Management Application
Stojanov et al. Evaluating software maintenance processes in small software company based on fuzzy screening
CN110322113A (zh) 基于马尔科夫链的配电网线损处理方法
CN110516853A (zh) 一种基于欠采样改进的AdaBoost算法的脱贫时间预测方法
Kaur et al. Performance evaluation of reusable software components
CN114580759B (zh) 一种城市低碳减排评估***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190510

RJ01 Rejection of invention patent application after publication