CN106469395A - 一种数据商品动态综合评估方法及*** - Google Patents

一种数据商品动态综合评估方法及*** Download PDF

Info

Publication number
CN106469395A
CN106469395A CN201610792027.8A CN201610792027A CN106469395A CN 106469395 A CN106469395 A CN 106469395A CN 201610792027 A CN201610792027 A CN 201610792027A CN 106469395 A CN106469395 A CN 106469395A
Authority
CN
China
Prior art keywords
data
assessment
commodity
information
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610792027.8A
Other languages
English (en)
Inventor
王婷婷
王晶
王江
孙玉权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoxin Youe Data Co Ltd
Original Assignee
Guoxin Youe Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoxin Youe Data Co Ltd filed Critical Guoxin Youe Data Co Ltd
Priority to CN201610792027.8A priority Critical patent/CN106469395A/zh
Publication of CN106469395A publication Critical patent/CN106469395A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种数据商品动态综合评估方法,包括以下步骤:S1、确定待进行动态综合评估的数据商品;S2、实时获取所述数据商品的数据质量评估信息、用户评价和数据相关文章量三种数据,并对三种数据进行数据评估;S3、根据数据评估的结果对所述数据商品进行动态综合评估。本发明的数据商品动态综合评估方法及***及其***,通过数据商品的多种信息来进行数据商品的综合评估,能够保证数据商品的评估更加全面、准确,同时,通过动态实时采集数据商品的信息,进一步的保证数据商品的评估结果更具时效性。

Description

一种数据商品动态综合评估方法及***
技术领域
本发明涉及数据处理技术领域,具体涉及一种数据商品动态综合评估方法及***。
背景技术
现今社会已经进入了数据化的时代,实体商品已经不再是仅存的交易对象,数据也成为了一种可交易的商品。
具体的说,数据商品是指在交易平台上进行交易使用的数据集。由于数据商品存在较大的的交易量,这将很可能会对数据商品的价格造成一定的影响,如不对数据商品进行实时性的监测的话,则在对数据商品进行交易的过程中,很可能会由于数据商品定价存在的时效性问题,而使得卖家或者买家的利益受到损害。
因此,如何提供一种既能够对数据商品进行动态实时评估的评估方法和***就成为了亟待解决的问题。
发明内容
本发明提供了一种数据商品动态综合评估方法及***,通过实时采集数据商品的数据并进行评估,使得数据商品的评估根据更好的时效性,同时进一步的保证了数据商品的评估更加的全面和准确。
本发明的第一部分提供了一种数据商品动态综合评估方法,包括以下步骤:
S1、确定待进行动态综合评估的数据商品;
S2、实时获取数据商品的数据质量评估信息、用户评价和数据相关文章量三种数据,并对三种数据进行数据评估;
S3、根据数据评估的结果通过以下方法对数据商品进行动态综合评估:
其中,P为动态综合评估得分;Pi为第i种数据的数据评估得分;Fi为第i种数据的项目权重。
优选的,数据质量评估信息的数据评估用评估指标包括数据一致性、数据完整性、数据冗余度、数据时效性和数据量;
数据质量的数据评估通过以下方法计算:
其中,P1为数据质量评估得分;Hj为第j项评估指标得分;Ej为第j项评估指标的指标权重。
所述数据一致性根据所述数据质量评估信息的实际数据量、实际数据大小、数据格式,以及元数据的记录数据量、记录文件大小、元数据数据格式来对所述数据质量评估信息的数据一致性进行指标评估;
且,所述数据一致性通过以下方法进行指标评估:
其中,H1为数据一致性指标评估得分;La表示实际数据量;Lm为元数据记录数据量;Sa为实际数据文件大小;Sm为元数据记录文件大小;P为数据格式一致性,其使用文件后缀名判别,如果文件后缀名与元数据中记录的数据名相同则赋值1,否则赋值为0。
进一步优选的,数据完整性根据数据质量评估信息的非空值量和全体的数据个数来对数据质量评估信息的数据完整性进行指标评估;且,数据完整性通过以下方法进行指标评估:
其中,H2为数据完整性指标评估得分;aij为第i行、第j列数据是否为空值,如果是空值则取0,不是空值则取1;N为全体的数据个数,当数据商品共m行、n列,则N=m×n,且m和n为自然数。
进一步优选的,数据冗余度根据数据质量评估信息中重复记录出现的次数,以及记录的总数来对数据质量评估信息的数据冗余度进行指标评估;且,数据冗余度通过以下方法进行指标评估:
其中,H3为数据冗余度指标评估得分;ci为第i条重复记录出现的次数;R为记录的总数。
进一步优选的,数据时效性根据数据质量评估信息记录的起始时间、最终时间和当前时间来对数据质量评估信息的数据时效性进行指标评估;且,数据时效性通过以下方法进行指标评估:
其中,H4为数据时效性指标评估得分;Tf为记录的最终时间,如无记录时间,则使用元数据时间;Ts为记录的起始时间,如无记录时间,则使用元数据时间;Tn为当前时间。
进一步优选的,数据量根据数据质量评估信息的评估全量数据量、元数据量和承诺数据来对数据质量评估信息的数据量进行指标评估;且,数据量通过以下方法进行指标评估:
其中,H5为数据量指标评估得分;x为当前的数据量;O1为评估全量数据量;O2为元数据量;O3是承诺数据。
优选的,用户评价根据所述用户评价中好评、中评和差评的占比来对用户评价进行数据评估;且,用户评价的数据评估通过以下方法计算:
P2=a1×1+a2×0.5+a3×0,a1+a2+a3=1;
其中,P2为用户评价评估得分;a1为用户评价中好评占比;a2为用户评价中中评占比;a3为用户评价中差评占比。
优选的,数据相关文章量根据检索到的数据商品的相关文章的数量来对数据相关文章量进行数据评估;且,数据相关文章量的数据评估通过以下方法计算:
其中,P3为数据相关文章量评估得分;Y为数据商品的相关文章的数量,e为自然对数的底数。
本发明的第二部分提供了一种数据商品动态综合评估***,包括:
模型构建服务器,确定待进行动态综合评估的数据商品,并针对数据商品构建动态评估模型;
数据获取终端,实时采集数据商品的数据质量评估信息、用户评价和数据相关文章量三种数据;
综合评估服务器,通过模型构建服务器构建的动态评估模型,并根据数据获取终端采集的三种数据,对数据商品进行动态综合评估。
优选的,综合评估服务器包括:
数据质量评估单元,用于根据数据质量评估信息进行数据质量评估;
用户评价评估单元,用于根据用户评价进行用户评价评估;
数据相关文章量评估单元,用于根据数据相关文章量进行数据相关文章量评估;
动态综合评估单元,用于根据数据质量评估单元、用户评价评估单元和数据相关文章量评估单元的评估结果进行数据商品的动态综合评价。
进一步优选的,数据质量评估单元包括:
一致性评估子单元,用于对数据质量评估信息进行一致性评估;
完整性评估子单元,用于对数据质量评估信息进行完整性评估;
冗余度评估子单元,用于对数据质量评估信息进行冗余度评估;
时效性评估子单元,用于对数据质量评估信息进行时效性评估
数据量评估子单元,用于对数据质量评估信息进行数据量评估;
数据质量评估子单元,用于根据一致性评估子单元、完整性评估子单元、冗余度评估子单元、时效性评估子单元和数据量评估子单元的评估结果进行数据质量评估。
动态综合评估单元根据所述数据商品的数据质量、用户评价和数据相关文章量来动态综合评估所述数据商品;
且,所述动态综合评估单元通过以下方法进行动态综合评估:
其中,P为动态综合评估得分;Pi为第i种数据的数据评估得分;Fi为第i种数据的项目权重。
进一步优选的,数据质量评估子单元根据数据质量评估信息的数据一致性、数据完整性、数据冗余度、数据时效性和数据量来评估数据质量评估信息的数据质量;且,所述数据质量评估子单元通过以下方法进行数据质量评估:
其中,P1为数据质量评估得分;Hj为第j项评估指标得分;Ej为第j项评估指标的指标权重。
进一步优选的,一致性评估子单元根据数据质量评估信息的实际数据量、实际数据大小、数据格式,以及元数据的记录数据量、记录文件大小、元数据数据格式来评估数据质量评估信息的数据一致性;且,一致性评估子单元通过以下方法进行一致性评估:
其中,H1为数据一致性指标评估得分;La表示实际数据量;Lm为元数据记录数据量;Sa为实际数据文件大小;Sm为元数据记录文件大小;P为数据格式一致性,其使用文件后缀名判别,如果文件后缀名与元数据中记录的数据名相同则赋值1,否则赋值为0。
进一步优选的,完整性评估子单元根据数据质量评估信息的非空值量和全体的数据个数来评估数据质量评估信息的数据完整性;且,完整性评估子单元通过以下方法进行完整性评估:
其中,H2为数据完整性指标评估得分;aij为第i行、第j列数据是否为空值,如果是空值则取0,不是空值则取1;N为全体的数据个数,当数据商品共m行、n列,则N=m×n,且m和n为自然数。
进一步优选的,冗余度评估子单元根据数据质量评估信息中重复记录出现的次数,以及记录的总数来评估数据质量评估信息的数据冗余度;且,冗余度评估子单元通过以下方法进行冗余度评估:
其中,H3为数据冗余度指标评估得分;ci为第i条重复记录出现的次数;R为记录的总数。
进一步优选的,时效性评估子单元根据数据质量评估信息记录的起始时间、最终时间和当前时间来评估数据质量评估信息的数据时效性;且,时效性评估子单元通过以下方法进行时效性评估:
其中,H4为数据时效性指标评估得分;Tf为记录的最终时间,如无记录时间,则使用元数据时间;Ts为记录的起始时间,如无记录时间,则使用元数据时间;Tn为当前时间。
进一步优选的,数据量评估子单元根据数据质量评估信息的评估全量数据量、元数据量和承诺数据来评估数据质量评估信息的数据量;且,数据量评估子单元通过以下方法进行数据量评估:
其中,H5为数据量指标评估得分;x为当前的数据量;O1为评估全量数据量;O2为元数据量;O3是承诺数据。
进一步优选的,用户评价评估单元根据用户评价中好评、中评和差评的占比来评估用户评价;且,用户评价评估单元通过以下方法进行用户评价评估:
P2=a1×1+a2×0.5+a3×0,a1+a2+a3=1;
其中,P2为用户评价评估得分;a1为用户评价中好评占比;a2为用户评价中中评占比;a3为用户评价中差评占比。
进一步优选的,数据相关文章量评估单元根据检索到的数据商品的相关文章的数量来评估数据相关文章量;且,数据相关文章量评估单元通过以下方法进行数据相关文章量评估:
其中,P3为数据相关文章量评估得分;Y为数据商品的相关文章的数量,e为自然对数的底数。
本发明的数据商品动态综合评估方法及***,通过数据商品的多种信息来进行数据商品的综合评估,能够保证数据商品的评估更加全面、准确,同时,通过动态实时采集数据商品的信息,进一步的保证数据商品的评估结果更具时效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明数据商品动态综合评估方法的一个实施例的流程图。
图2为本发明数据商品动态综合评估***的一个实施例的逻辑回归函数图像。
图3为本发明数据商品动态综合评估***的一个实施例的***图。
图4为本发明数据商品动态综合评估***的一个实施例的层阶图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明数据商品动态综合评估方法的一个实施例的流程图,如图1所示,本实施例中,数据商品动态综合评估方法,包括以下步骤:
S1、确定待进行动态综合评估的数据商品;
S2、实时获取数据商品的数据质量评估信息、用户评价和数据相关文章量三种数据,并对三种数据进行数据评估;
S3、根据数据评估的结果通过以下公式对数据商品进行动态综合评估:
其中,P为动态综合评估得分;Pi为第i种数据的数据评估得分;Fi为第i种数据的项目权重。
具体的,S1中确定需要进行动态综合评估的数据商品,以便后续针对该数据商品进行相关数据的采集,并根据采集的数据进行动态综合评估。
S2中针对需要进行动态综合评估的数据商品进行数据质量评估信息、用户评价和数据相关文章量等三种数据的实时采集获取,并对采集到的数据质量评估信息、用户评价和数据相关文章量三种数据进行数据评估,以便得到数据质量评估得分、用户评级评估得分和数据相关文章量评估得分。
其中,对数据质量评估信息进行数据评估时,需要针对不同的评估指标进行评估,本实施例中,其评估指标共有五个,即:数据一致性、数据完整性、数据冗余度、数据时效性和数据量。
数据一致性是判断数据内容中各类数据与数据结构描述信息的一致性程度,而数据结构描述信息分为数据的非结构化、半结构化和结构化程度。
本实施例中,数据一致性可根据数据质量评估信息的实际数据量、实际数据大小、数据格式,以及元数据的记录数据量、记录文件大小、元数据数据格式来对数据质量评估信息的数据一致性进行指标评估,且,数据一致性可具体通过以下公式1进行指标评估:
公式1
其中,H1为数据一致性指标评估得分;La表示实际数据量;Lm为元数据记录数据量;Sa为实际数据文件大小;Sm为元数据记录文件大小;P为数据格式一致性,其使用文件后缀名判别,如果文件后缀名与元数据中记录的数据名相同则赋值1,否则赋值为0。
根据以上的公式1可知,最终求得的H1的取值范围为[0-1],而H1的取值越大,则说明数据一致性越好,数据的价值越高。
并且,其中提及的元数据还可称为中介数据、中继数据,其为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
数据完整性是计算数据有效数据在总数据量中的占比。
本实施例中,数据完整性是指数据商品中具有实际使用意义的非空值量和全体的数据的占比情况。
则,数据完整性可具体通过以下公式2进行指标评估:
公式2
其中,H2为数据完整性指标评估得分;aij为第i行、第j列数据是否为空值,如果是空值则取0,不是空值则取1;N为全体的数据个数,当数据商品共m行、n列,则N=m×n,且m和n为自然数。
根据以上的公式2可知,最终求得的H2的取值范围为[0-1],而H2的值越大,则说明数据完整性越好。
数据冗余度是计算数据中重复数据的出现的比率。通常在一个数据集合中重复的数据被称为数据冗余,而数据冗余度越高,则该数据的价值越小。
本实施例中,数据冗余度根据数据质量评估信息中重复记录出现的次数,以及记录的总数来对数据质量评估信息的数据冗余度进行指标评估,且,数据冗余度可具体通过以下公式3进行指标评估:
公式3
其中,H3为数据冗余度指标评估得分;ci为第i条重复记录出现的次数;R为记录的总数。
根据以上的公式3可知,最终求得的H3的取值范围为[0-1],而H3的值越大,则说明数据重复性越小,数据的价值越高。
数据时效性是计算数据所代表的时间区间与数据提供时间之间的关系。通常,数据记录的时间范围越大,距离当前时间越近,则数据的价值越高。
本实施例中,数据时效性根据数据质量评估信息记录的起始时间、最终时间和当前时间来对数据质量评估信息的数据时效性进行指标评估,且,数据时效性可具体通过以下公式4进行指标评估:
公式4
其中,H4为数据时效性指标评估得分;Tf为记录的最终时间,如无记录时间,则使用元数据时间;Ts为记录的起始时间,如无记录时间,则使用元数据时间;Tn为当前时间。
根据以上的公式4可知,最终求得的H4的取值范围为[0-1],而H4的值越大,则说明数据的时效性越强,数据的价值越高。
针对于本实施例,时间单位精确到天即可。
数据量是根据采集的各个数据交易平台对于同类数据的数据量,以及数据描述信息内对所提供数据量的描述,判断实际接收到的有效数据量的占比。
本实施例中,数据量根据数据质量评估信息的评估全量数据量、元数据量和承诺数据来对数据质量评估信息的数据量进行指标评估,且,数据量可具体通过以下公式5进行指标评估:
公式5
其中,H5为数据量指标评估得分;x为当前的数据量;O1为评估全量数据量;O2为元数据量;O3是承诺数据。
根据以上的公式5可知,最终求得的H5的取值范围为[0-1],而H5=0时,则说明数据量小,反之数据量大。
以及,其中提及的评估全量数据表示相应类型数据的全量数据,例如:个人记录的全量数据是中国15亿人;省份数据的全量数据是中国33个省等。而承诺数据是最初承诺的数据量。
根据以上公式1至公式5所分别计算出的数据一致性指标评估得分、数据完整性指标评估得分、数据冗余度指标评估得分、数据时效性指标评估得分和数据量指标评估得分可对数据质量评估信息的数据质量进行评估。
具体的,数据质量的数据评估通过以下公式6计算:
公式6
其中,P1为数据质量评估得分;Hj为第j项评估指标得分;Ej为第j项评估指标的指标权重。
参考以上针对数据一致性、数据完整性、数据冗余度、数据时效性和数据量等五个指标的指标评估顺数。
则,当j=1时,H1为数据一致性指标评估得分,其通过以上公式1求出,E1为数据一致性得分在数据质量评估中所占的指标权重。
同理可知,当j=2时,H2为数据完整性指标评估得分,其通过以上公式2求出,E2为数据完整性得分在数据质量评估中所占的指标权重;当j=3时,H3为数据冗余度指标评估得分,其通过以上公式3求出,E3为数据冗余度得分在数据质量评估中所占的指标权重;当j=4时,H4为数据时效性指标评估得分,其通过以上公式4求出,E4为数据时效性得分在数据质量评估中所占的指标权重;当j=5时,H5为数据量指标评估得分,其通过以上公式5求出,E5为数据量得分在数据质量评估中所占的指标权重。
而数据质量评估评估过程中,针对数据一致性指标评估得分、数据完整性指标评估得分、数据冗余度指标评估得分、数据时效性指标评估得分和数据量指标评估得分五项不同评估指标在数据质量评估中所占的指标权重则可通过下表1来选取。
表1
即,通过上表1可知,在数据质量评估评估过程中,数据一致性指标评估得分、数据完整性指标评估得分、数据冗余度指标评估得分、数据时效性指标评估得分和数据量指标评估得分五项不同评估指标在数据质量评估中所占的指标权重分别为0.25、0.25、0.15、0.2和0.15。
基于此可根据数据一致性指标评估得分、数据完整性指标评估得分、数据冗余度指标评估得分、数据时效性指标评估得分获得数据质量评估得分。
针对数据商品的情况,往往具有较多的用户评价,而在用户评价中,其还可分为好评、中评和差评三个分类。
如果针对用户评价中不同分类的评价条数占比情况进行评价,则能够有效的获得用户对数据商品的反馈信息。
同时,通过对用户评价的实时动态获取,则能够更加准确、有效的获得用户对数据商品的评价信息以及反馈信息。
用户评价的数据评估通过以下公式7计算:
公式7
P2=a1×1+a2×0.5+a3×0,a1+a2+a3=1;
其中,P2为用户评价评估得分;a1为用户评价中好评占比;a2为用户评价中中评占比;a3为用户评价中差评占比。
数据相关文章量是指通过相关学术搜索该数据商品的名称后,获得的精准关联的文章数量,根据获得的文章数量能够评价数据商品的热度情况,是用户买家更加明确的了解该数据商品的情况。
针对数据商品的引用文件数量,根据逻辑回归函数特性,建立等级得分函数,将能够更加明确、有效的将数据相关文章量引入数据商品的评价中使用。
同时,通过对数据相关文章量进行实时动态获取,则将能够更加准确的获得数据商品的相关文章来量。
数据相关文章量的数据评估通过以下公式8计算:
公式8
其中,P3为数据相关文章量评估得分;Y为数据商品的相关文章的数量,e为自然对数的底数。
根据以上公式8,以及等级得分函数的特性可知,当数据相关引用文章量等于0时,则数据相关文章量评估得分为P3={0;(Y=0)};当数据相关引用文章量等于1时,则数据相关文章量评估得分为P3={0.075;(Y=1)}。
由于数据相关引用文章量的取值范围为整数,则根据如图2所示的逻辑回归函数的图像可以得出,等级得分函数的取值将会在数据相关文章量为104处趋向于1,即,当数据相关文章量超过1万条时,数据相关文章量评估得分已经趋向于1,因此,根据等级得分函数的性质在此处规定其得分为1。
最终,通过以上分别求出的数据质量评估得分、用户评价评估得分和数据相关文章量评估得分将能够对数据商品进行动态综合评估,并得出最终数据商品的动态综合评估得分。
数据商品进行动态综合评估通过以下公式9计算:
公式9
其中,P为动态综合评估得分;Pi为第i种数据的数据评估得分;Fi为第i种数据的项目权重。
当i=1时,P1为数据质量评估得分,其通过以上公式6求出,F1为数据质量评估得分在动态综合评估中所占的项目权重。
同理可知,当i=2时,P2为用户评价评估得分,其通过以上公式7求出,F2为用户评价评估得分在动态综合评估中所占的项目权重;当i=3时,P3为数据相关文章量评估得分,其通过以上公式8求出,F3为数据相关文章量评估得分在动态综合评估中所占的项目权重。
而数据商品动态综合评估过程中,针对数据质量评估得分、用户评价评估得分和数据相关文章量评估得分三项不同数据在评估中所占的项目权重则可通过下表2来选取。
表2
即,根据表2可知,在数据商品动态综合评估过程中数据质量评估得分、用户评价评估得分和数据相关文章量评估得分三项所对应的项目权重分别为0.45、0.3、0.25,且通过以上项目权重以及各项对应的评估得分将能够获得数据商品的动态综合评估得分。
实施例二
图3为本发明数据商品动态综合评估***的一个实施例的***图;图4为本发明数据商品动态综合评估***的一个实施例的层阶图。
如图3、4所示,本实施例中数据商品动态综合评估***,包括:
模型构建服务器,确定待进行动态综合评估的数据商品,并针对数据商品构建动态评估模型;
数据获取终端,实时采集数据商品的数据质量评估信息、用户评价和数据相关文章量三种数据;
综合评估服务器,通过所述模型构建服务器构建的动态评估模型,并根据所述数据获取终端采集的三种数据,对数据商品进行动态综合评估。
具体的,模型构建服务器,先确定需要进行动态综合评估的数据商品,之后针对该数据商品进行动态评估模型构建。
其中,如图4所示,在动态评估模型中可具体的划分为三个阶层,即目标层、方案层和指标层,其具体对应于数据商品动态综合评价的最终评价结果、评价过程以及评价指标。
其中,指标层具体包括针对数据商品数据质量、用户评价和数据相关文章量三个方面的结构。
方案层中分别针对指标层中获取的数据来进行动态综合评估方案的构建,其具体包括针对数据质量、用户评价和数据相关文章量进行分别评估的结构。
最终,目标层通过方案层所得到的数据来对数据商品进行最终的动态综合评估。
通过数据获取终端来对数据商品的数据质量评估信息、用户评价和数据相关文章量的数据进行实时获取。
进一步的,在数据获取终端中,其可进一步包括:用于采集数据质量评估信息的质量评估信息获取单元;用于实时采集用户评价的用户评价获取单元;以及用于实时采集数据相关文章量的相关文章获取单元。
通过质量评估信息获取单元、用户评价获取单元和相关文章获取单元来分别针对数据质量评估信息、用户评价和数据相关文章量的数据进行能够保证数据的实时获取更加快速,保证数据商品相关数据的时效性。
而综合评估服务器中,其可进一步的包括:用于根据所述数据质量评估信息进行数据质量评估的数据质量评估单元;用于根据所述用户评价进行用户评价评估的用户评价评估单元;,用于根据所述数据相关文章量进行数据相关文章量评估的数据相关文章量评估单元;以及用于根据所述数据质量评估单元、用户评价评估单元和数据相关文章量评估单元的评估结果进行所述数据商品的动态综合评价的动态综合评估单元。
其中,数据质量评估单元可通过上述的公式1至6,结合质量评估信息获取单元所采集的数据质量评估信息来计算数据商品的数据质量评估得分。
再进一步的,数据质量评估单元可具体包括:用于对数据质量评估信息进行一致性评估的一致性评估子单元;用于对数据质量评估信息进行完整性评估的完整性评估子单元;用于对数据质量评估信息进行冗余度评估的冗余度评估子单元;用于对数据质量评估信息进行时效性评估的时效性评估子单元;用于对数据质量评估信息进行数据量评估的数据量评估子单元;以及用于根据所述一致性评估子单元、完整性评估子单元、冗余度评估子单元、时效性评估子单元和数据量评估子单元的评估结果进行所述数据质量评估的数据质量评估子单元。
其中,一致性评估子单元、完整性评估子单元、冗余度评估子单元、时效性评估子单元、数据量评估子单元和数据质量评估子单元可分别通过以上公式1、2、3、4、5和6来计算数据质量的数据一致性指标评估得分、数据完整性指标评估得分、数据冗余度指标评估得分、数据时效性指标评估得分、数据量指标评估得分以及数据质量评估得分,以此来辅助数据商品的动态综合评估。
用户评价评估单元可通过以上的公式7,结合用户评价获取单元所实时获取的用户评价来计算数据商品的用户评价评估得分。
数据相关文章量评估单元可通过以上的公式8,结合相关文章获取单元实时获取的数据相关文章量来计算数据商品的数据相关文章量评估得分。
动态综合评估单元可通过以上的公式9,结合数据质量评估单元、用户评价评估单元和数据相关文章量评估单元计算出的数据质量评估得分、用户评价评估得分和数据相关文章量评估得分来计算数据商品的动态综合评估得分。
最终,通过计算出的数据商品的动态综合评估得分,能够使买家和卖家更加方便的了解到该数据商品的全面信息,同时还保证了数据商品评价信息具有更高的时效性,为买家和卖家做出最终决定提供了有效的数据支持。
本发明的数据商品动态综合评估方法及***及其***,通过数据商品的多种信息来进行数据商品的综合评估,能够保证数据商品的评估更加全面、准确,同时,通过动态实时采集数据商品的信息,进一步的保证数据商品的评估结果更具时效性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (22)

1.一种数据商品动态综合评估方法,其特征在于,包括以下步骤:
S1、确定待进行动态综合评估的数据商品;
S2、实时获取所述数据商品的数据质量评估信息、用户评价和数据相关文章量三种数据,并对三种数据进行数据评估;
S3、根据数据评估的结果通过以下方法对所述数据商品进行动态综合评估:
P = Σ i 3 P i F i , i = 1 , 2 , 3 ;
其中,P为动态综合评估得分;Pi为第i种数据的数据评估得分;Fi为第i种数据的项目权重。
2.根据权利要求1所述的数据商品动态综合评估方法,其特征在于,
所述数据质量评估信息的数据评估用评估指标包括数据一致性、数据完整性、数据冗余度、数据时效性和数据量;
所述数据质量的数据评估通过以下方法计算:
P 1 = Σ j 5 H j E j , j = 1 , 2 , 3 , 4 , 5 ;
其中,P1为数据质量评估得分;Hj为第j项评估指标得分;Ej为第j项评估指标的指标权重。
3.根据权利要求2所述的数据商品动态综合评估方法,其特征在于,
所述数据一致性根据所述数据质量评估信息的实际数据量、实际数据大小、数据格式,以及元数据的记录数据量、记录文件大小、元数据数据格式来对所述数据质量评估信息的数据一致性进行指标评估;
且,所述数据一致性通过以下方法进行指标评估:
H 1 = 1 3 ( | L a - L m | max ( L a , L m ) + | S a - S m | max ( S a , S m ) + P ) , P ∈ { 0 , 1 } ;
其中,H1为数据一致性指标评估得分;La表示实际数据量;Lm为元数据记录数据量;Sa为实际数据文件大小;Sm为元数据记录文件大小;P为数据格式一致性,其使用文件后缀名判别,如果文件后缀名与元数据中记录的数据名相同则赋值1,否则赋值为0。
4.根据权利要求2所述的数据商品动态综合评估方法,其特征在于,
所述数据完整性根据所述数据质量评估信息的非空值量和全体的数据个数来对所述数据质量评估信息的数据完整性进行指标评估;
且,所述数据完整性通过以下方法进行指标评估:
H 2 = Σ i = 1 , j = 1 N a i j N ;
其中,H2为数据完整性指标评估得分;aij为第i行、第j列数据是否为空值,如果是空值则取0,不是空值则取1;N为全体的数据个数,当数据商品共m行、n列,则N=m×n,且m和n为自然数。
5.根据权利要求2所述的数据商品动态综合评估方法,其特征在于,
所述数据冗余度根据所述数据质量评估信息中重复记录出现的次数,以及记录的总数来对所述数据质量评估信息的数据冗余度进行指标评估;
且,所述数据冗余度通过以下方法进行指标评估:
H 3 = 1 - Σ i = 1 R c i R ;
其中,H3为数据冗余度指标评估得分;ci为第i条重复记录出现的次数;R为记录的总数。
6.根据权利要求2所述的数据商品动态综合评估方法,其特征在于,
所述数据时效性根据所述数据质量评估信息记录的起始时间、最终时间和当前时间来对所述数据质量评估信息的数据时效性进行指标评估;
且,所述数据时效性通过以下方法进行指标评估:
H 4 = T f - T s T n - T s ;
其中,H4为数据时效性指标评估得分;Tf为记录的最终时间,如无记录时间,则使用元数据时间;Ts为记录的起始时间,如无记录时间,则使用元数据时间;Tn为当前时间。
7.根据权利要求2所述的数据商品动态综合评估方法,其特征在于,
所述数据量根据所述数据质量评估信息的评估全量数据量、元数据量和承诺数据来对所述数据质量评估信息的数据量进行指标评估;
且,所述数据量通过以下方法进行指标评估:
H 5 = 1 3 ( x O 1 + x O 2 + x O 3 ) ;
其中,H5为数据量指标评估得分;x为当前的数据量;O1为评估全量数据量;O2为元数据量;O3是承诺数据。
8.根据权利要求1所述的数据商品动态综合评估方法,其特征在于,
所述用户评价根据所述用户评价中好评、中评和差评的占比来对用户评价进行数据评估;
且,所述用户评价的数据评估通过以下方法计算:
P2=a1×1+a2×0.5+a3×0,a1+a2+a3=1;
其中,P2为用户评价评估得分;a1为用户评价中好评占比;a2为用户评价中中评占比;a3为用户评价中差评占比。
9.根据权利要求1所述的数据商品动态综合评估方法,其特征在于,
所述数据相关文章量根据检索到的所述数据商品的相关文章的数量来对数据相关文章量进行数据评估;
且,所述数据相关文章量的数据评估通过以下方法计算:
P 3 = 0 ; ( Y = 0 ) 0.075 ; ( Y = 1 ) 1 1 + e - log 10 Y ; ( Y ≥ 2 ) ;
其中,P3为数据相关文章量评估得分;Y为数据商品的相关文章的数量,e为自然对数的底数。
10.一种数据商品动态综合评估***,其特征在于,包括:
模型构建服务器,确定待进行动态综合评估的数据商品,并针对所述数据商品构建动态评估模型;
数据获取终端,实时采集所述数据商品的数据质量评估信息、用户评价和数据相关文章量三种数据;
综合评估服务器,通过所述模型构建服务器构建的动态评估模型,并根据所述数据获取终端采集的三种数据,对数据商品进行动态综合评估。
11.根据权利要求10所述的数据商品动态综合评估***,其特征在于,
所述数据获取终端包括:
质量评估信息获取单元,用于采集数据质量评估信息;
用户评价获取单元,用于实时采集用户评价;
相关文章获取单元,用于实时采集数据相关文章量。
12.根据权利要求11所述的数据商品动态综合评估***,其特征在于,
所述综合评估服务器包括:
数据质量评估单元,用于根据所述数据质量评估信息进行数据质量评估;
用户评价评估单元,用于根据所述用户评价进行用户评价评估;
数据相关文章量评估单元,用于根据所述数据相关文章量进行数据相关文章量评估;
动态综合评估单元,用于根据所述数据质量评估单元、用户评价评估单元和数据相关文章量评估单元的评估结果进行所述数据商品的动态综合评价。
13.根据权利要求12所述的数据商品动态综合评估***,其特征在于,
所述数据质量评估单元包括:
一致性评估子单元,用于对数据质量评估信息进行一致性评估;
完整性评估子单元,用于对数据质量评估信息进行完整性评估;
冗余度评估子单元,用于对数据质量评估信息进行冗余度评估;
时效性评估子单元,用于对数据质量评估信息进行时效性评估
数据量评估子单元,用于对数据质量评估信息进行数据量评估;
数据质量评估子单元,用于根据所述一致性评估子单元、完整性评估子单元、冗余度评估子单元、时效性评估子单元和数据量评估子单元的评估结果进行所述数据质量评估。
14.根据权利要求12所述的数据商品动态综合评估***,其特征在于,
所述动态综合评估单元根据所述数据商品的数据质量、用户评价和数据相关文章量来动态综合评估所述数据商品;
且,所述动态综合评估单元通过以下方法进行动态综合评估:
P = Σ i 3 P i F i , i = 1 , 2 , 3 ;
其中,P为动态综合评估得分;Pi为第i种数据的数据评估得分;Fi为第i种数据的项目权重。
15.根据权利要求14所述的数据商品动态综合评估***,其特征在于,
所述数据质量评估子单元根据所述数据质量评估信息的数据一致性、数据完整性、数据冗余度、数据时效性和数据量来评估所述数据质量评估信息的数据质量;
且,所述所述数据质量评估子单元通过以下方法进行所述数据质量评估:
P 1 = Σ j 5 H j E j , j = 1 , 2 , 3 , 4 , 5 ;
其中,P1为数据质量评估得分;Hj为第j项评估指标得分;Ej为第j项评估指标的指标权重。
16.根据权利要求15所述的数据商品动态综合评估***,其特征在于,
所述一致性评估子单元根据所述数据质量评估信息的实际数据量、实际数据大小、数据格式,以及元数据的记录数据量、记录文件大小、元数据数据格式来评估所述数据质量评估信息的数据一致性;
且,所述一致性评估子单元通过以下方法进行所述一致性评估:
H 1 = 1 3 ( | L a - L m | max ( L a , L m ) + | S a - S m | max ( S a , S m ) + P ) , P ∈ { 0 , 1 } ;
其中,H1为数据一致性指标评估得分;La表示实际数据量;Lm为元数据记录数据量;Sa为实际数据文件大小;Sm为元数据记录文件大小;P为数据格式一致性,其使用文件后缀名判别,如果文件后缀名与元数据中记录的数据名相同则赋值1,否则赋值为0。
17.根据权利要求15所述的数据商品动态综合评估***,其特征在于,
所述完整性评估子单元根据所述数据质量评估信息的非空值量和全体的数据个数来评估所述数据质量评估信息的数据完整性;
且,所述完整性评估子单元通过以下方法进行所述完整性评估:
H 2 = Σ i = 1 , j = 1 N a i j N ;
其中,H2为数据完整性指标评估得分;aij为第i行、第j列数据是否为空值,如果是空值则取0,不是空值则取1;N为全体的数据个数,当数据商品共m行、n列,则N=m×n,且m和n为自然数。
18.根据权利要求15所述的数据商品动态综合评估***,其特征在于,
所述冗余度评估子单元根据所述数据质量评估信息中重复记录出现的次数,以及记录的总数来评估所述数据质量评估信息的数据冗余度;
且,所述冗余度评估子单元通过以下方法进行所述冗余度评估:
H 3 = 1 - Σ i = 1 R c i R ;
其中,H3为数据冗余度指标评估得分;ci为第i条重复记录出现的次数;R为记录的总数。
19.根据权利要求15所述的数据商品动态综合评估***,其特征在于,
所述时效性评估子单元根据所述数据质量评估信息记录的起始时间、最终时间和当前时间来评估所述数据质量评估信息的数据时效性;
且,所述时效性评估子单元通过以下方法进行所述时效性评估:
H 4 = T f - T s T n - T s ;
其中,H4为数据时效性指标评估得分;Tf为记录的最终时间,如无记录时间,则使用元数据时间;Ts为记录的起始时间,如无记录时间,则使用元数据时间;Tn为当前时间。
20.根据权利要求15所述的数据商品动态综合评估***,其特征在于,
所述数据量评估子单元根据所述数据质量评估信息的评估全量数据量、元数据量和承诺数据来评估所述数据质量评估信息的数据量;
且,所述数据量评估子单元通过以下方法进行所述数据量评估:
H 5 = 1 3 ( x O 1 + x O 2 + x O 3 ) ;
其中,H5为数据量指标评估得分;x为当前的数据量;O1为评估全量数据量;O2为元数据量;O3是承诺数据。
21.根据权利要求14所述的数据商品动态综合评估***,其特征在于,
所述用户评价评估单元根据所述用户评价中好评、中评和差评的占比来评估用户评价;
且,所述用户评价评估单元通过以下方法进行用户评价评估:
P2=a1×1+a2×0.5+a3×0,a1+a2+a3=1;
其中,P2为用户评价评估得分;a1为用户评价中好评占比;a2为用户评价中中评占比;a3为用户评价中差评占比。
22.根据权利要求14所述的数据商品动态综合评估***,其特征在于,
所述数据相关文章量评估单元根据检索到的所述数据商品的相关文章的数量来评估数据相关文章量;
且,所述数据相关文章量评估单元通过以下方法进行数据相关文章量评估:
P 3 = 0 ; ( Y = 0 ) 0.075 ; ( Y = 1 ) 1 1 + e - log 10 Y ; ( Y ≥ 2 ) ;
其中,P3为数据相关文章量评估得分;Y为数据商品的相关文章的数量,e为自然对数的底数。
CN201610792027.8A 2016-08-31 2016-08-31 一种数据商品动态综合评估方法及*** Pending CN106469395A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610792027.8A CN106469395A (zh) 2016-08-31 2016-08-31 一种数据商品动态综合评估方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610792027.8A CN106469395A (zh) 2016-08-31 2016-08-31 一种数据商品动态综合评估方法及***

Publications (1)

Publication Number Publication Date
CN106469395A true CN106469395A (zh) 2017-03-01

Family

ID=58230389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610792027.8A Pending CN106469395A (zh) 2016-08-31 2016-08-31 一种数据商品动态综合评估方法及***

Country Status (1)

Country Link
CN (1) CN106469395A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107807972A (zh) * 2017-10-19 2018-03-16 北京科技大学 一种试验数据一致性检测方法
CN108734405A (zh) * 2018-05-24 2018-11-02 国信优易数据有限公司 一种数据价值评估平台和方法
CN108764705A (zh) * 2018-05-24 2018-11-06 国信优易数据有限公司 一种数据质量评估平台以及方法
CN108764995A (zh) * 2018-05-24 2018-11-06 国信优易数据有限公司 一种数据价值确定***和方法
CN108829750A (zh) * 2018-05-24 2018-11-16 国信优易数据有限公司 一种数据质量确定***以及方法
CN110059083A (zh) * 2019-04-24 2019-07-26 北京金堤科技有限公司 一种数据评价方法、装置和电子设备
CN110766429A (zh) * 2018-07-26 2020-02-07 国信优易数据有限公司 一种数据价值评估***及方法
CN110766428A (zh) * 2018-07-25 2020-02-07 国信优易数据有限公司 一种数据价值评估***以及方法
CN110858369A (zh) * 2018-08-24 2020-03-03 国信优易数据有限公司 一种数据价值评估***、方法及电子设备
CN113691523A (zh) * 2021-08-20 2021-11-23 中国科学技术大学先进技术研究院 面向实时网络流量密码应用评估方法和终端设备

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107807972A (zh) * 2017-10-19 2018-03-16 北京科技大学 一种试验数据一致性检测方法
CN107807972B (zh) * 2017-10-19 2020-12-22 北京科技大学 一种试验数据一致性检测方法
CN108734405A (zh) * 2018-05-24 2018-11-02 国信优易数据有限公司 一种数据价值评估平台和方法
CN108764705A (zh) * 2018-05-24 2018-11-06 国信优易数据有限公司 一种数据质量评估平台以及方法
CN108764995A (zh) * 2018-05-24 2018-11-06 国信优易数据有限公司 一种数据价值确定***和方法
CN108829750A (zh) * 2018-05-24 2018-11-16 国信优易数据有限公司 一种数据质量确定***以及方法
CN110766428A (zh) * 2018-07-25 2020-02-07 国信优易数据有限公司 一种数据价值评估***以及方法
CN110766429A (zh) * 2018-07-26 2020-02-07 国信优易数据有限公司 一种数据价值评估***及方法
CN110858369A (zh) * 2018-08-24 2020-03-03 国信优易数据有限公司 一种数据价值评估***、方法及电子设备
CN110059083A (zh) * 2019-04-24 2019-07-26 北京金堤科技有限公司 一种数据评价方法、装置和电子设备
CN113691523A (zh) * 2021-08-20 2021-11-23 中国科学技术大学先进技术研究院 面向实时网络流量密码应用评估方法和终端设备
CN113691523B (zh) * 2021-08-20 2023-10-10 中科国昱(合肥)科技有限公司 面向实时网络流量密码应用评估方法和终端设备

Similar Documents

Publication Publication Date Title
CN106469395A (zh) 一种数据商品动态综合评估方法及***
Shen et al. A pricing model for big personal data
Brezigar-Masten et al. CART-based selection of bankruptcy predictors for the logit model
Jerven Comparability of GDP estimates in S ub‐S aharan A frica: The effect of Revisions in Sources and Methods Since Structural Adjustment
Olczyk A systematic retrieval of international competitiveness literature: a bibliometric study
Tsalis et al. A social LCA framework to assess the corporate social profile of companies: Insights from a case study
CN108133013A (zh) 信息处理方法、装置、计算机设备和存储介质
Morhardt Scoring corporate environmental reports for comprehensiveness: a comparison of three systems
CN103310353B (zh) 一种抗攻击的数据过滤优化***和方法
CN107729519B (zh) 基于多源多维数据的评估方法及装置、终端
CN110766428A (zh) 一种数据价值评估***以及方法
Eckhaus Corporate transformational leadership's effect on financial performance
CN108573339A (zh) 一种多指标投影决策法的消费者网购风险评估方法
CN110659926A (zh) 一种数据价值评估***以及方法
Hajkowicz Rethinking the economist’s evaluation toolkit in light of sustainability policy
CN105740434A (zh) 网络信息评分方法及装置
Zhao Economic policy uncertainty and manufacturing value-added exports
CN106203864A (zh) 一种基于大数据的品牌资产评估方法及***
CN113283806A (zh) 企业信息评估方法、装置、计算机设备及存储介质
CN105447117A (zh) 一种用户聚类的方法和装置
CN111709669A (zh) 一种企业信用评分***及方法
Dubey et al. Contextual relationship among antecedents of truck freight using interpretive structural modelling and its validation using MICMAC analysis
MacEachern Measuring the added value of library and information services: the New Zealand approach
Chen et al. [Retracted] Credit Risk Assessment of e‐Commerce Supply Chain Finance of SMEs Based on Dynamic Reward and Punishment Perspective
Murugan Creation of a recommendation system to recommend cryptocurrency portfolio using Association rule mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170301