CN109146611B - 一种电商产品质量评价方法及*** - Google Patents
一种电商产品质量评价方法及*** Download PDFInfo
- Publication number
- CN109146611B CN109146611B CN201810781686.0A CN201810781686A CN109146611B CN 109146611 B CN109146611 B CN 109146611B CN 201810781686 A CN201810781686 A CN 201810781686A CN 109146611 B CN109146611 B CN 109146611B
- Authority
- CN
- China
- Prior art keywords
- index
- data
- commodity
- credit
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 26
- 238000011156 evaluation Methods 0.000 claims description 46
- 239000011159 matrix material Substances 0.000 claims description 41
- 238000013210 evaluation model Methods 0.000 claims description 27
- 239000002994 raw material Substances 0.000 claims description 25
- 238000004519 manufacturing process Methods 0.000 claims description 22
- 238000007689 inspection Methods 0.000 claims description 21
- 230000007613 environmental effect Effects 0.000 claims description 17
- 238000013139 quantization Methods 0.000 claims description 15
- 238000013461 design Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000011835 investigation Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 238000012797 qualification Methods 0.000 claims description 5
- 230000017105 transposition Effects 0.000 claims description 5
- 230000008447 perception Effects 0.000 claims description 4
- 238000011161 development Methods 0.000 abstract description 5
- 239000003814 drug Substances 0.000 description 13
- 229940079593 drug Drugs 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000008213 purified water Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电子商务,旨在提供一种电商产品质量评价方法及***。该种电商产品质量评价方法,先定义用于构建所述电商产品质量信用指数的指标,按层次得到每个商品的初始电商产品质量信用指数,再计算以时间为维度的每个商品所对应指标的工具变量的原始增长率,并修正所述原始增长率以获得修正后增长率的算法;利用修正后增长率对历史电商产品质量信用指数进行更新的算法;最后集合每个商品的质量信用指数及投票权来计算得到总体行业的电商产品质量信用指数。本发明是一种对电商产品质量评价的创新性计算方法,能对电商产品进行深入分析,能够如实刻画电商产品发展波动的轨迹,有效监测电商产品行业的发展态势。
Description
技术领域
本发明是关于电子商务领域,特别涉及一种电商产品质量评价方法及***。
背景技术
电子商务运用越来越广泛,很多电商平台如天猫、京东都极大地便利了人们的生活,用户对产品质量的关注不断增加,然而仅仅凭借电商平台的网上用户评论来判断商品的好坏仍具有一定的局限性,比如部分商家通过不正常的手段刷好评,或者恶意评论竞争对手的商品,这些都会给用户造成误导。信息的不对称、不全面、不透明,致使用户无法科学有效决策,进而无法根据自己意愿选择电商平台的高质量商品,长此以往不仅会造成不愉快的使用体验,甚至会扰乱电商市场。因此,需要公开透明许多有关商品的信息,使用户和商家信息对等,用户方能全面地了解商品的各个维度。
传统的商品评价方法有因子分析法,对评论真实度情感分析,提取产品质量特征词进行产品综合评价等方法。这些方法普遍都过于重视对评论的情感分析,没有将线下如产品质检报告,制造商的劳动力资本等要素考虑在内,而且采用的机器学习方法如神经网络训练权重价格昂贵,不同商品采用普遍性的标准不够准确,上述方案均不能很好的完成。
针对目前电子商务领域存在的假冒伪劣、消费者对产品良莠难辨、传统产品质量监管手段不适用等现状,产生了很多基于互联网环境的产品质量信用评价模型,它们一般包含如下几个主要工作流程:首先从异构的***数据源中采集跨域数据,将不同类型和结构的原始数据清洗、处理成统一框架下的标准化数据,对非结构化数据中的关键信息通过相应信息抽取算法提取出来完成结构化过程,将这些综合性的数据提交给统一的产品质量数据仓库;然后通过大数据分析计算,建立统一的产品质量检测与管理信息模型,得到产品质量信用分数;最后权威发布电商产品质量信用指数评价结果。
在学术界,国内外对于电子商务产品质量评价体系的研究也开始从大量的理论研究进入数据引用阶段。王立志等人以产品质量的符合性、适用性和外部性为基础,构建了包含固有质量、感知质量和损失质量的产品质量概念模型,设计了具有可操作性质量评价指标体系。骆庆华从电子商务的发展背景入手,分析了电子商务产品质量及监管体系建设问题。LKCML Wu开发了一种九步的QFD产品质量评价***。Zeithaml等人的研究通过与有在线购物经验的客户进行了六焦点小组访谈,得出可靠性、可访问性、安全性、易于登录、担保/信任、网站美观、反应性、个性化/定制化、价格知识、灵活性、效用11个维度为电子服务质量的影响因素。
近年来提出了以消费者为授信方、生产者为受信方的产品质量信用概念,目前我国已推出国家产品质量信用平台,包含了基础信息、标准信息、原材料信息、添加剂信息、产品防伪信息、产品监督抽查记录等,但是这个平台信息上的信息量还是比较缺乏,无法满足大多数消费者的需求。在学术界,陈欢等人通过分析我国产品质量信用现状,建立一套完善的产品质量信用评价体系,并为我国建立产品质量信用评价体系提供一些建议。王立志在对产品质量信用基本内涵和信用等级划分的基础上,研究了产品质量信用及其构成要素。Vaidya O.S提出了层次分析法在电子商务质量评估环境下的应用。刘松国等人在此基础上,结合应用电子商务理论、产品质量管理和信用评价理论,建立B2C电子商务产品质量信用评价指标体系的模型,并利用模糊综合AHP结构层次分析法来对电子商务企业信用管理体系进行评价。
如上所述,目前关于电商产品质量信用指数评估模型的研究成果很多,采用的方法也很广泛,与本发明最相近似的实现方案有下面几种。
1、基于大数据的电子商务行业景气度指数***和方法(201610138024.2)。提出了一种基于大数据的电子商务行业评价方法,其特点是对主要体现指标进行数据统计,组成矩阵并进行标准化处理,通过Pearson相关系数检验,得到相关性分析,再采用因子旋转的方法确定其实际意义。但是,在因子分析中,因子个数需要人为指定,而且在众多影响因素中,公因子的实际意义往往不那么明显。针对不同类目的产品,都使用同一组指标缺乏灵活性,比如水和拉杆箱显然无法用相同的衡量标准。
2、一种信用评分模型更新方法及***(201711308017.3)。提供一种可实时监测当前信用评分模型的运行情况,解决了现有技术中不能及时更新信用评分模型导致信用评分不准确等的问题,可自动识别目前舆情、法律、条例等对模型信息属性集中属性的可靠性,减少目前政策波动期中面临的外部风险,进一步提升了信用评分模型的适应性,合理地设置信用评分模型的更新周期,提高信用评分***的性能。它的不足之处在于没有考虑模型指标在时间维度上的变化情况,因此缺乏对时间维度上信用指数变化情况的表示。
3、一种电子商务产品质量的风险评价方法(201711392410.5)。该方法包括三个步骤:语料库获取、中文自然语言处理和质量风险评价,核心是后两个步骤:对原始数据清理后,用自然语言处理工具对评论语料进行初次分词及词性标注、新词识别、评论真实度情感分析等预处理获得结构化的情感分析结果并保存到数据库中,进一步,训练条件随机场模型,最后利用其提取质量特征词;提出商家信用综合评价表,统计出信用指数,设计出评价融合模型,根据评分计算产品的风险等级。但是,该算法只考虑了评论文本来对产品进行风险预测,较为片面,没有综合考虑产品质检数据等其他因素。
4、一种互联网药品质量信用评估方法(201510507262.1)。该方法通过获取的药品识别信息来识别药品,获取药品质量指标数据,根据药品质量指标数据对药品的各项药品质量指标进行评估,得出药品的各项药品质量指标的评估结果。最后计算得出药品的药品质量风险指数。该发明的局限在于质量指标数据仅针对互联网药品这个类别,而无法对其他互联网产品类别进行评估和分析。另外,互联网内容处于不断变化和发展的过程,该发明所述的互联网药品质量信用评估方法没有考虑到时间因素对质量信用的影响。
5、企业质量信用数据获取方法和***(201611129883.1)。该发明通过对企业质量信用相关的数据进行预处理,并进行知识挖掘得到模板数据从而提取从语料中提取出与模板对应的企业质量信用数据。其重点在于如何得到具有一致性,准确性和全面性的企业质量信用数据,但未明确介绍如何将该数据用于构建质量信用模型,从而对企业的质量信用进行评估。
上面五个专利虽然都能在一定程度上对产品质量评价,但是要适用到具体产品,他们还存在如下的不足:
商品评价过分依赖线上数据。但在电商平台评论不一定起了决定性作用,更重要的是线下国家质监局及政府委托的第三方质检公司对商品的检测报告;针对不同商品的评价过于一般化,比如纯净水和拉杆箱的评价标准显然很难一样,相同指标的重要程度也大不一样,不同类目产品之间存在很大差异性,用单一评价标准无法确保评价的有效性,给消费者提供准确参考。
发明内容
本发明的主要目的在于克服现有技术中的不足,提供一种更加灵活、完善的针对电商产品质量的评价方法及***。
为解决上述技术问题,本发明的解决方案是:
提供一种电商产品质量评价方法,具体包括下述步骤:
步骤(1):采集并融合多源跨平台的电商产品质量数据;
先从异构的***数据源中采集数据对象,采集完成后,将不同类型和不同结构的原始数据清洗、处理成统一框架下的标准化数据;
异构的***数据源包括结构化的数据源和非结构化的数据源;结构化的数据源中存储结构化数据,结构化数据包括产品质量检验报告、商家征信记录和电商平台产品属性数据;非结构化的数据源中存储非结构化数据,非结构化数据包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本和产品质量舆情信息;
标准化数据是指:将原始数据按比例缩放到一个特定区间,去除数据的单位限制,形成的无量纲的纯数值的数据(标准化数据便于不同单位或量级的指标能够进行比较和加权);
不同类型和不同结构的原始数据处理后,得到的标准化数据分为结构化的标准化数据和非结构化的标准化数据:
对于结构化的标准化数据,直接提交给统一的产品质量数据仓库(产品质量数据仓库用于存储数据);
对于非结构化的标准化数据,先将非结构化的标准化数据中的关键信息,通过相应信息抽取算法提取出来完成结构化过程,变成结构化的标准化数据后,再提交给统一的产品质量数据仓库;
步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量;
电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层;
目标层设置指标:电商产品质量信用,电商产品质量信用于作为评价该电商产品质量的数据;
概念层设置指标:固有质量、损失质量、感知质量、商家信用和质量追溯;其中,固有质量、损失质量和感知质量共同构成产品质量;
指标层设置指标:标准化指标、生产指标、设计指标、原材料指标、安全性指标、环保性指标、消费者指标、三方指标、服务指标、基础指标、金融指标、信用指标和溯源指标;
数据层即步骤(1)所述的产品质量数据仓库,存储有:产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据(平台自身运行数据),用于作为电商产品质量信用指数评价模型的数据来源;
技术层对各层指标进行降维操作,用于减少指标数量(把多指标转化为少数几个综合指标),计算得到最终的电商产品质量信用指数(技术层贯穿这个电商产品质量信用指数模型的关键技术,一方面可以解决“维数灾难”,缓解“信息丰富、知识贫乏”现状,降低复杂度,提高运算精度和运算效率;另一方面可以更好地认识和理解数据,寻找质量信用数据内部的本质结构特征);
在电商产品质量信用指数评价模型中,存在层次指标框架,具体是指:
概念层的指标,共同对应上层次目标层的电商产品质量信用指数;
指标层的指标,对应上层次概念层的指标:标准化指标、生产指标、设计指标和原材料指标对应概念层的固有质量,安全性指标和环保性指标对应概念层的损失质量,消费者指标、三方指标和服务指标对应概念层的感知质量,基础指标、金融指标和信用指标对应概念层的商家信用,溯源指标对应概念层的质量追溯;
指标层的指标,分别对应不同的工具变量:标准化指标对应制造许可证和节能环保认证;生产指标对应流水线管理和生产环境控制;设计指标对应功能实用性;原材料指标对应原材料质量检验和原材料运输存储;安全性指标对应安全损害性;环保性指标对应环保损害性;消费者指标对应消费者满意度;三方指标对应行业协会评价和媒体评价;服务指标对应售前和售后服务;基础指标对应工商登记信息、纳税情况、法定资质和劳动力投入;金融指标对应信贷信息和保险信息;信用指标对应企业质量信用;溯源指标对应产品质量追溯网络;
步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型;
制定量化标准(根据专业知识对各个工具变量划分等级区间,以工具变量所在区间作为量化值,这里的量化标准可由专家制定),并根据量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值;
指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量;
步骤(4):构造判断矩阵并计算各层次指标权重;
分别对目标层、概念层、指标层中的各指标的相对重要性给出判断,并用数值表示出来,写成矩阵形式即形成判断矩阵(判断矩阵表示针对上一层次某因素而言,本层次与之有关的各因素之间的相对重要性);然后,对判断矩阵按行进行归一化,得到每一个指标的权重;
每一层次指标的权重计算方法具体为:
其中,T是指矩阵转置;
对向量N进行归一化处理,即求得该行每一个元素的权重Pi:
步骤(5):按权重合成每个商品的初始电商产品质量信用指数;
对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数ConceptionIndexij0:
其中,bk是商品i的工具变量k的初始数值;wk是商品i的工具变量k所对应的指标的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
然后,对概念层的初始质量信用指数进行加权,得到目标层指标的初始质量信用指数Indexi0:
其中,uj是概念层指标j的权重,即由步骤(4)计算得到;
步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率;
对应数值类型的增长率算法:
其中,i是指商品i;t是指月份t;RelativeRatioit是指商品i在t月的工具变量的原始增长率;Xit是指商品i在t月的工具变量的值,Xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指标层的每个指标所对应的工具变量值;
对应状态类型的增长率算法:
对应比例类型的增长率算法:
其中,Zit是指商品i在t月的比例类型工具变量值,Zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指标层的每个指标所对应的工具变量值;
步骤(7):修正原始增长率以获得修正后增长率;
根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+INF],其中INF是指无穷大;
电商产品质量信用指数评价模型中的指标类型分为:流量类型指标、比例类型指标和状态类型指标;
根据工具变量对应的指标的类型,标准化增长率的方式具体为:
方式1)对于流量类型或者比例类型的指标对应的工具变量:
方式2)对于状态类型的指标对应的工具变量:
RelativeRatio′it=RelativeRatioit
步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数;
计算每个商品的产品质量信用指数的方法,具体为:
通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率IndexRationit:
其中,RelativeRatio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数Indexit:
Indexit=Indexit-1*(1+IndexRatioit)
其中,Indexit-1是前一个月份的产品质量信用指数(因由步骤(5)计算得到了初始质量信用指数Indexi0,故能得到Indexit-1的值);所述符号“*”是指乘法运算;
步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数;
计算每个商品的投票权变量,具体包括下述方法步骤为:
方法步骤1):确定销量总和的占比超过市场总销量的固定百分比r的前topN商品;topN值的计算方法为:将商品销量按从大到小排序,取前topN个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;
其中,r为常数,取值范围为:10%~50%(r默认为30%);
方法步骤2):计算集中度ratio:
其中,volumetopN为近N个月所述topN商品的销量和;N为常数,取值范围为:1~12;mean(volume)为该行业中的同类商品的平均销量;
方法步骤3):根据销量和集中度计算投票权voteit:
其中,volumeit为近M个月商品i的平均成交量;M为自然数,取值范围为1~5(M优选为3);voteit是商品i在t月的投票权;τ是指投票温度,取值范围为0~1,设置τ越小则销量高的商品权重越高;所述items是指该行业中的同类商品集合(要确定产品质量信用的商品i的市场同类商品集合);volumekt是指商品k在t月的销量,k指商品k;符号“*”是指乘法运算;
集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:
其中,items是指该行业中的同类商品集合;L默认值为100;
计算得到的总体产品质量信用指数Indext,即为最终评价电商产品当前月份的质量信用的数据,该值越大,则产品质量信用越好。
提供一种电商产品质量评价***,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适用于由处理器加载并执行:
步骤(1):采集并融合多源跨平台的电商产品质量数据;
先从异构的***数据源中采集数据对象,采集完成后,将不同类型和不同结构的原始数据清洗、处理成统一框架下的标准化数据;
异构的***数据源包括结构化的数据源和非结构化的数据源;结构化的数据源中存储结构化数据,结构化数据包括产品质量检验报告、商家征信记录和电商平台产品属性数据;非结构化的数据源中存储非结构化数据,非结构化数据包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本和产品质量舆情信息;
标准化数据是指:将原始数据按比例缩放到一个特定区间,去除数据的单位限制,形成的无量纲的纯数值的数据(标准化数据便于不同单位或量级的指标能够进行比较和加权);
不同类型和不同结构的原始数据处理后,得到的标准化数据分为结构化的标准化数据和非结构化的标准化数据:
对于结构化的标准化数据,直接提交给统一的产品质量数据仓库(产品质量数据仓库用于存储数据);
对于非结构化的标准化数据,先将非结构化的标准化数据中的关键信息,通过相应信息抽取算法提取出来完成结构化过程,变成结构化的标准化数据后,再提交给统一的产品质量数据仓库;
步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量;
电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层;
目标层设置指标:电商产品质量信用,电商产品质量信用于作为评价该电商产品质量的数据;
概念层设置指标:固有质量、损失质量、感知质量、商家信用和质量追溯;其中,固有质量、损失质量和感知质量共同构成产品质量;
指标层设置指标:标准化指标、生产指标、设计指标、原材料指标、安全性指标、环保性指标、消费者指标、三方指标、服务指标、基础指标、金融指标、信用指标和溯源指标;
数据层即步骤(1)所述的产品质量数据仓库,存储有:产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据(平台自身运行数据),用于作为电商产品质量信用指数评价模型的数据来源;
技术层对各层指标进行降维操作,用于减少指标数量(把多指标转化为少数几个综合指标),计算得到最终的电商产品质量信用指数(技术层贯穿这个电商产品质量信用指数模型的关键技术,一方面可以解决“维数灾难”,缓解“信息丰富、知识贫乏”现状,降低复杂度,提高运算精度和运算效率;另一方面可以更好地认识和理解数据,寻找质量信用数据内部的本质结构特征);
在电商产品质量信用指数评价模型中,存在层次指标框架,具体是指:
概念层的指标,共同对应上层次目标层的电商产品质量信用指数;
指标层的指标,对应上层次概念层的指标:标准化指标、生产指标、设计指标和原材料指标对应概念层的固有质量,安全性指标和环保性指标对应概念层的损失质量,消费者指标、三方指标和服务指标对应概念层的感知质量,基础指标、金融指标和信用指标对应概念层的商家信用,溯源指标对应概念层的质量追溯;
指标层的指标,分别对应不同的工具变量:标准化指标对应制造许可证和节能环保认证;生产指标对应流水线管理和生产环境控制;设计指标对应功能实用性;原材料指标对应原材料质量检验和原材料运输存储;安全性指标对应安全损害性;环保性指标对应环保损害性;消费者指标对应消费者满意度;三方指标对应行业协会评价和媒体评价;服务指标对应售前和售后服务;基础指标对应工商登记信息、纳税情况、法定资质和劳动力投入;金融指标对应信贷信息和保险信息;信用指标对应企业质量信用;溯源指标对应产品质量追溯网络;
步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型;
制定量化标准(根据专业知识对各个工具变量划分等级区间,以工具变量所在区间作为量化值,这里的量化标准可由专家制定),并根据量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值;
指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量;
步骤(4):构造判断矩阵并计算各层次指标权重;
分别对目标层、概念层、指标层中的各指标的相对重要性给出判断,并用数值表示出来,写成矩阵形式即形成判断矩阵(判断矩阵表示针对上一层次某因素而言,本层次与之有关的各因素之间的相对重要性);然后,对判断矩阵按行进行归一化,得到每一个指标的权重;
每一层次指标的权重计算方法具体为:
其中,T是指矩阵转置;
对向量N进行归一化处理,即求得该行每一个元素的权重Pi:
步骤(5):按权重合成每个商品的初始电商产品质量信用指数;
对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数ConceptionIndexij0:
其中,bk是商品i的工具变量k的初始数值;wk是商品i的工具变量k所对应的指标的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
然后,对概念层的初始质量信用指数进行加权,得到目标层指标的初始质量信用指数Indexi0:
其中,uj是概念层指标j的权重,即由步骤(4)计算得到;
步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率;
对应数值类型的增长率算法:
其中,i是指商品i;t是指月份t;RelativeRatioit是指商品i在t月的工具变量的原始增长率;Xit是指商品i在t月的工具变量的值,Xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指标层的每个指标所对应的工具变量值;
对应状态类型的增长率算法:
对应比例类型的增长率算法:
其中,Zit是指商品i在t月的比例类型工具变量值,Zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指标层的每个指标所对应的工具变量值;
步骤(7):修正原始增长率以获得修正后增长率;
根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+INF],其中INF是指无穷大;
电商产品质量信用指数评价模型中的指标类型分为:流量类型指标、比例类型指标和状态类型指标;
根据工具变量对应的指标的类型,标准化增长率的方式具体为:
方式1)对于流量类型或者比例类型的指标对应的工具变量:
方式2)对于状态类型的指标对应的工具变量:
RelativeRatio′it=RelativeRatioit
步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数;
计算每个商品的产品质量信用指数的方法,具体为:
通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率IndexRationit:
其中,RelativeRatio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数Indexit:
Indexit=Indexit-1*(1+IndexRatioit)
其中,Indexit-1是前一个月份的产品质量信用指数(因由步骤(5)计算得到了初始质量信用指数Indexi0,故能得到Indexit-1的值);所述符号“*”是指乘法运算;
步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数;
计算每个商品的投票权变量,具体包括下述方法步骤为:
方法步骤1):确定销量总和的占比超过市场总销量的固定百分比r的前topN商品;topN值的计算方法为:将商品销量按从大到小排序,取前topN个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;
其中,r为常数,取值范围为:10%~50%(r默认为30%);
方法步骤2):计算集中度ratio:
其中,volumetopN为近N个月所述topN商品的销量和;N为常数,取值范围为:1~12;mean(volume)为该行业中的同类商品的平均销量;
方法步骤3):根据销量和集中度计算投票权voteit:
其中,volumeit为近M个月商品i的平均成交量;M为自然数,取值范围为1~5(M优选为3);voteit是商品i在t月的投票权;τ是指投票温度,取值范围为0~1,设置τ越小则销量高的商品权重越高;所述items是指该行业中的同类商品集合(要确定产品质量信用的商品i的市场同类商品集合);volumekt是指商品k在t月的销量,k指商品k;符号“*”是指乘法运算;
集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:
其中,items是指该行业中的同类商品集合;L默认值为100;
计算得到的总体产品质量信用指数Indext,即为最终评价电商产品当前月份的质量信用的数据,该值越大,则产品质量信用越好。
本发明的整体框架:先定义用于构建所述电商产品质量信用指数的指标,按层次得到每个商品的初始电商产品质量信用指数,再计算以时间为维度的每个商品所对应指标的工具变量的原始增长率,并修正所述原始增长率以获得修正后增长率的算法。利用修正后增长率对历史电商产品质量信用指数进行更新的算法。最后集合每个商品的质量信用指数及投票权来计算得到总体行业的电商产品质量信用指数。这一整套流程可以计算出电商产品质量信用指数,流程中的每一步都不可以改变。
与现有技术相比,本发明的有益效果是:
本发明通过电商产品质量信用指数评价模型,综合平台接入的产品质检数据、商家征信记录、用户评价数据、政府相关数据和质量舆情等信息,结合线上线下信息,进行量化综合评价,从而提供给用户更加全面可靠的商品质量指数,以便用户做出选择。
商品评价一定程度上依赖线上数据,而本发明更重要的是将线下数据,如企业的资本、劳动力、规模,以及国家质监局及政府委托的第三方质检公司对商品的检测报告,纳入考评维度,并将其分为数值、状态、比例等不同类型计算增长率;针对不同商品,根据其所属类目的不同由专家讨论确立其权重,如纯净水和拉杆箱的评价标准显然很难一样,同指标的重要程度也大不一样。
本发明将时间因素考虑在内,在时间维度不断更新电商产品的投票权和质量信用指数,而给消费者提供更加准确的参考。
本发明除了包含传统的电商平台评论及舆情分析,还提出新的思路,在不同类目对产品设置不同评价的指标,增强类目间产品区分度,为关心产品质量的用户提供了快捷、准确并且专业的结果。
本发明是一种对电商产品质量评价的创新性计算方法,能对电商产品进行深入分析,能够如实刻画电商产品发展波动的轨迹,有效监测电商产品行业的发展态势。
附图说明
图1为本发明中的电商产品质量信用指数评价模型示意图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
一种电商产品质量评价方法,通过建立电商产品质量信用指数,并通过指数值来展示分析结果;进一步具体来讲,通过采集某一类商品的各个制造商的商业数据,进而提炼指标,并量化指标,随后计算得到该类电商产品质量信用指数值。
该种电商产品质量评价方法,具体包括下述步骤:
步骤(1):采集并融合多源跨平台的电商产品质量数据。
数据抓取采集层主要负责从异构的***数据源中采集数据对象,其中结构化的数据源包括产品质量检验报告、商家征信记录、电商平台产品属性数据等;非结构化的数据源包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本、产品质量舆情信息等。在完成数据采集工作后,将不同类型和结构的原始数据清洗、处理成统一框架下的标准化数据,对非结构化数据中的关键信息通过相应信息抽取算法提取出来完成结构化过程,将这些综合性的数据提交给统一的产品质量数据仓库,为后续操作奠定数据基础。
步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量。
如图1所示,电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层。目标层是整个模型最终的目标,即电商产品质量信用指标。概念层是产品质量信用包含的三个概念,即产品质量、商家信用和质量追溯,产品质量又包括固有质量、损失质量和感知质量;概念层是产品质量信用评价的在产品、商家、物流三个维度的粗粒度概念目标。指标层是评价体系模型的中间层,为将质量信用概念进行分解所得的评价质量信用指标集合;指标层对应于概念层的多方面的细粒度评价指标,它们分别对应于不同数据来源提取出来的产品质量信用特征。数据层是整个模型的数据来源,包含了产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据(平台自身运行数据)。技术层是质量大数据降维技术,是贯穿这个电商产品质量信用指数模型的关键技术。这五个层面的分工合作,组成完整的电商产品质量信用指数评价模型。
具体的,用于构建指数框架的指标层划分为:
1)用于构建所述产品质量指数的指标框架部分,其类型包括:固有质量指标、损失质量指标和感知质量指标。产品质量中的固有质量分为标准化指标、生产指标、设计指标和原材料指标。产品的损失质量分为安全性指标和环保性指标。产品的感知质量分为消费者指标、三方指标和服务指标。
2)用于构建所述商家信用指数的指标框架部分,其类型包括:基础指标、金融指标和信用指标。基础指标是企业的符合规范程度,包括企业基础信息、登记信息、法定资质、纳税等的情况;金融指标是企业的信贷和保险,这里就涉及到第三方信贷机构和保险机构的信任传播;信用指标主要是该企业生产的产品质量信用的综合。
3)用于构建所述质量追溯指数的指标框架部分,质量追溯的指标是溯源指标,需要对来自原材料供应商、生产环节、物流方和销售卖家的数据,对原材料供应商提供的原料、标准、关联的卖家和产品标签进行统计分类,对厂家产品进行登记录入,并记录产家和卖家使用的物流方信息,最后注册销售卖家的身份信息和检验信息,构建产品质量追溯网络。
所述产品质量指标框架、商家信用指标框架和质量追溯指标框架中的指标是分为树状结构的多级的,例如以下表1所示,展示所有指标与工具变量的关系。
表1评价指标层次表
需说明的是,表1中的各项指标仅为列举,在实际情况中均可以进行增、删或替代,并非以此表为限。
步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型。
根据专家制定的量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值。
然后,指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量。
专家制定的量化标准是指:根据专业知识对各个工具变量划分等级区间,以工具变量所在区间作为量化值。
步骤(4):构造判断矩阵并计算各层次指标权重。
判断矩阵表示对每一层次各指标的相对重要性给出的判断,这些判断用数值表示出来,写成矩阵形式就是判断矩阵。判断矩阵表示针对上一层次某因素而言,本层次与之有关的各因素之间的相对重要性。对判断矩阵按行进行归一化,得到每一个指标的权重。
目标层A到概念层B的判断矩阵如下表2所示,概念层指标对于电商产品质量信用的权重的计算方法为:
其中,T是指矩阵转置;
对向量N进行归一化处理,求得:P1=0.41,P2=0.26,P3=0.11,P4=0.04,P5=0.18。Wi=(0.41,0.26,0.11,0.04,0.18)T。
表2 A-B判断矩阵及权重
表2中的各项权重仅为举例,可以根据实际情况进行修改,并非以此表为限。
步骤(5):按权重合成每个商品的初始电商产品质量信用指数。
对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数ConceptionIndexij0:
其中,bk是商品i的工具变量k的初始数值;wk是工具变量k在计算指数过程中的权重;indicators指属于概念层指标j的指标层对应的工具变量的集合;
然后,对概念层的初始质量信用指数进行加权,得到目标层的初始质量信用指数Indexi0:
其中,uj是概念层指标j的初始质量信用指数在合成指数中的权重;
步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率。
对应数值类型的增长率算法:
其中,i是指商品i;t是指月份t;RelativeRatioit是指商品i在t月的工具变量的原始增长率;Xit是指商品i在t月的工具变量的值,Xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指指标层的每个指标所对应的工具变量值;
对应状态类型的增长率算法:
对应比例类型的增长率算法:
其中,Zit是指商品i在t月的比例类型工具变量值,Zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指指标层的每个指标所对应的工具变量值;
步骤(7):修正原始增长率以获得修正后增长率。
根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+INF],其中INF是指无穷大;
标准化增长率的方式为:
方式1)对于流量类型或者比例类型的指标对应的工具变量:
方式2)对于状态类型的指标对应的工具变量:
RelativeRatio′it=RelativeRatioit
步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数。
计算每个商品的质量信用指数需要的方法,具体为:
通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率IndexRationit:
其中,RelativeRatio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数Indexit:
Indexit=Indexit-1*(1+IndexRatioit)
步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数。
计算每个商品的投票权变量,具体包括下述方法步骤为:
方法步骤1):计算销量总和的占比超过市场总销量的固定百分比r的前topN商品中的topN值;
topN值的计算方法为:将商品销量按从大到小排序,取前topN个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;
其中,r为常数,取值范围为:10%-50%(r默认为30%);
方法步骤2):计算集中度:
方法步骤3):根据销量和集中度计算投票权voteit:
其中,volumeit为近M个月商品i的平均成交量;M为自然数,取值范围为:1-5(M优选为3);voteit是商品i在t月的投票权;τ是指投票温度,取值范围为:0-1,τ越小则销量高的商品权重越高;所述items是指所有商品集合;
集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:
其中,items是指本专利要确定产品质量信用的商品i的市场同类商品集合;L默认值为100;
计算得到的总体产品质量信用指数Indext,即为最终评价电商产品当前月份的质量信用的数据,该值越大,则产品质量信用越好。
最后,需要注意的是,以上列举的仅是本发明的具体实施例。显然,本发明不限于以上实施例,还可以有很多变形。本领域的普通技术人员能从本发明公开的内容中直接导出或联想到的所有变形,均应认为是本发明的保护范围。
Claims (2)
1.一种电商产品质量评价方法,其特征在于,具体包括下述步骤:
步骤(1):采集并融合多源跨平台的电商产品质量数据;
先从异构的***数据源中采集数据对象,采集完成后,将不同类型和不同结构的原始数据清洗、处理成统一框架下的标准化数据;
异构的***数据源包括结构化的数据源和非结构化的数据源;结构化的数据源中存储结构化数据,结构化数据包括产品质量检验报告、商家征信记录和电商平台产品属性数据;非结构化的数据源中存储非结构化数据,非结构化数据包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本和产品质量舆情信息;
标准化数据是指:将原始数据按比例缩放到一个特定区间,去除数据的单位限制,形成的无量纲的纯数值的数据;
不同类型和不同结构的原始数据处理后,得到的标准化数据分为结构化的标准化数据和非结构化的标准化数据:
对于结构化的标准化数据,直接提交给统一的产品质量数据仓库;
对于非结构化的标准化数据,先将非结构化的标准化数据中的关键信息,通过相应信息抽取算法提取出来完成结构化过程,变成结构化的标准化数据后,再提交给统一的产品质量数据仓库;
步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量;
电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层;
目标层设置指标:电商产品质量信用,电商产品质量信用于作为评价该电商产品质量的数据;
概念层设置指标:固有质量、损失质量、感知质量、商家信用和质量追溯;其中,固有质量、损失质量和感知质量共同构成产品质量;
指标层设置指标:标准化指标、生产指标、设计指标、原材料指标、安全性指标、环保性指标、消费者指标、三方指标、服务指标、基础指标、金融指标、信用指标和溯源指标;
数据层即步骤(1)所述的产品质量数据仓库,存储有:产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据,用于作为电商产品质量信用指数评价模型的数据来源;
技术层对各层指标进行降维操作,用于减少指标数量,计算得到最终的电商产品质量信用指数;
在电商产品质量信用指数评价模型中,存在层次指标框架,具体是指:
概念层的指标,共同对应上层次目标层的电商产品质量信用指数;
指标层的指标,对应上层次概念层的指标:标准化指标、生产指标、设计指标和原材料指标对应概念层的固有质量,安全性指标和环保性指标对应概念层的损失质量,消费者指标、三方指标和服务指标对应概念层的感知质量,基础指标、金融指标和信用指标对应概念层的商家信用,溯源指标对应概念层的质量追溯;
指标层的指标,分别对应不同的工具变量:标准化指标对应制造许可证和节能环保认证;生产指标对应流水线管理和生产环境控制;设计指标对应功能实用性;原材料指标对应原材料质量检验和原材料运输存储;安全性指标对应安全损害性;环保性指标对应环保损害性;消费者指标对应消费者满意度;三方指标对应行业协会评价和媒体评价;服务指标对应售前和售后服务;基础指标对应工商登记信息、纳税情况、法定资质和劳动力投入;金融指标对应信贷信息和保险信息;信用指标对应企业质量信用;溯源指标对应产品质量追溯网络;
步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型;
制定量化标准,并根据量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值;
指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量;
步骤(4):构造判断矩阵并计算各层次指标权重;
分别对目标层、概念层、指标层中的各指标的相对重要性给出判断,并用数值表示出来,写成矩阵形式即形成判断矩阵;然后,对判断矩阵按行进行归一化,得到每一个指标的权重;
每一层次指标的权重计算方法具体为:
其中,T是指矩阵转置;
对向量N进行归一化处理,即求得该行每一个元素的权重Pi:
步骤(5):按权重合成每个商品的初始电商产品质量信用指数;
对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数ConceptionIndexij0:
其中,bk是商品i的工具变量k的初始数值;wk是商品i的工具变量k所对应的指标的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
然后,对概念层的初始质量信用指数进行加权,得到目标层指标的初始质量信用指数Indexi0:
其中,uj是概念层指标j的权重,即由步骤(4)计算得到;
步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率;
对应数值类型的增长率算法:
其中,i是指商品i;t是指月份t;RelativeRatioit是指商品i在t月的工具变量的原始增长率;Xit是指商品i在t月的工具变量的值,Xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指标层的每个指标所对应的工具变量值;
对应状态类型的增长率算法:
对应比例类型的增长率算法:
其中,Zit是指商品i在t月的比例类型工具变量值,Zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指标层的每个指标所对应的工具变量值;
步骤(7):修正原始增长率以获得修正后增长率;
根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+INF],其中INF是指无穷大;
电商产品质量信用指数评价模型中的指标类型分为:流量类型指标、比例类型指标和状态类型指标;
根据工具变量对应的指标的类型,标准化增长率的方式具体为:
方式1)对于流量类型或者比例类型的指标对应的工具变量:
x是指商品i在t月的工具变量的原始增长率,由步骤(6)计算得到;
方式2)对于状态类型的指标对应的工具变量:
RelativeRatio′it=RelativeRatioit
步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数;
计算每个商品的产品质量信用指数的方法,具体为:
通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率IndexRationit:
其中,RelativeRatio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数Indexit:
Indexit=Indexit-1*(1+IndexRatioit)
其中,Indexit-1是前一个月份的产品质量信用指数;符号“*”是指乘法运算;
步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数;
计算每个商品的投票权变量,具体包括下述方法步骤为:
方法步骤1):确定销量总和的占比超过市场总销量的固定百分比r的前topN商品;topN值的计算方法为:将商品销量按从大到小排序,取前topN个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;
其中,r为常数,取值范围为:10%~50%;
方法步骤2):计算集中度ratio:
其中,volumetopN为近N个月所述topN商品的销量和;N为常数,取值范围为:1~12;mean(volume)为该行业中的同类商品的平均销量;
方法步骤3):根据销量和集中度计算投票权voteit:
其中,volumeit为近M个月商品i的平均成交量;M为自然数,取值范围为1~5;voteit是商品i在t月的投票权;τ是指投票温度,取值范围为0~1,设置τ越小则销量高的商品权重越高;items是指该行业中的同类商品集合;volumekt是指商品k在t月的销量,k指商品k;符号“*”是指乘法运算;
集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:
其中,items是指该行业中的同类商品集合;L默认值为100;
计算得到的总体产品质量信用指数Indext,即为最终评价电商产品当前月份的质量信用的数据,总体产品质量信用指数的值越大,则产品质量信用越好。
2.一种电商产品质量评价***,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适用于由处理器加载并执行:
步骤(1):采集并融合多源跨平台的电商产品质量数据;
先从异构的***数据源中采集数据对象,采集完成后,将不同类型和不同结构的原始数据清洗、处理成统一框架下的标准化数据;
异构的***数据源包括结构化的数据源和非结构化的数据源;结构化的数据源中存储结构化数据,结构化数据包括产品质量检验报告、商家征信记录和电商平台产品属性数据;非结构化的数据源中存储非结构化数据,非结构化数据包括文本化的产品质量检测结果数据、电商平台上针对产品的用户评价文本和产品质量舆情信息;
标准化数据是指:将原始数据按比例缩放到一个特定区间,去除数据的单位限制,形成的无量纲的纯数值的数据;
不同类型和不同结构的原始数据处理后,得到的标准化数据分为结构化的标准化数据和非结构化的标准化数据:
对于结构化的标准化数据,直接提交给统一的产品质量数据仓库;
对于非结构化的标准化数据,先将非结构化的标准化数据中的关键信息,通过相应信息抽取算法提取出来完成结构化过程,变成结构化的标准化数据后,再提交给统一的产品质量数据仓库;
步骤(2):定义电商产品质量信用指数评价模型,构建用于表示电商产品质量信用指数的层次指标框架,并确定用于表示所定义指标的工具变量;
电商产品质量信用指数评价模型包括目标层、概念层、指标层、数据层和技术层;
目标层设置指标:电商产品质量信用,电商产品质量信用于作为评价该电商产品质量的数据;
概念层设置指标:固有质量、损失质量、感知质量、商家信用和质量追溯;其中,固有质量、损失质量和感知质量共同构成产品质量;
指标层设置指标:标准化指标、生产指标、设计指标、原材料指标、安全性指标、环保性指标、消费者指标、三方指标、服务指标、基础指标、金融指标、信用指标和溯源指标;
数据层即步骤(1)所述的产品质量数据仓库,存储有:产品质检数据、电商平台数据、政府数据、溯源数据、金融机构数据、三方机构数据、商家数据和运行数据,用于作为电商产品质量信用指数评价模型的数据来源;
技术层对各层指标进行降维操作,用于减少指标数量,计算得到最终的电商产品质量信用指数;
在电商产品质量信用指数评价模型中,存在层次指标框架,具体是指:
概念层的指标,共同对应上层次目标层的电商产品质量信用指数;
指标层的指标,对应上层次概念层的指标:标准化指标、生产指标、设计指标和原材料指标对应概念层的固有质量,安全性指标和环保性指标对应概念层的损失质量,消费者指标、三方指标和服务指标对应概念层的感知质量,基础指标、金融指标和信用指标对应概念层的商家信用,溯源指标对应概念层的质量追溯;
指标层的指标,分别对应不同的工具变量:标准化指标对应制造许可证和节能环保认证;生产指标对应流水线管理和生产环境控制;设计指标对应功能实用性;原材料指标对应原材料质量检验和原材料运输存储;安全性指标对应安全损害性;环保性指标对应环保损害性;消费者指标对应消费者满意度;三方指标对应行业协会评价和媒体评价;服务指标对应售前和售后服务;基础指标对应工商登记信息、纳税情况、法定资质和劳动力投入;金融指标对应信贷信息和保险信息;信用指标对应企业质量信用;溯源指标对应产品质量追溯网络;
步骤(3):量化层次指标框架中的工具变量,并确定工具变量类型;
制定量化标准,并根据量化标准,对所述工具变量进行量化,得到各个工具变量的量化值,作为各个工具变量的初始数值;
指定各个工具变量的类型,工具变量的类型分为:数值类型变量、状态类型变量、比例类型变量;
步骤(4):构造判断矩阵并计算各层次指标权重;
分别对目标层、概念层、指标层中的各指标的相对重要性给出判断,并用数值表示出来,写成矩阵形式即形成判断矩阵;然后,对判断矩阵按行进行归一化,得到每一个指标的权重;
每一层次指标的权重计算方法具体为:
其中,T是指矩阵转置;
对向量N进行归一化处理,即求得该行每一个元素的权重Pi:
步骤(5):按权重合成每个商品的初始电商产品质量信用指数;
对步骤(3)得到的工具变量的初始数值进行加权,计算得到概念层指标j的初始质量信用指数ConceptionIndexij0:
其中,bk是商品i的工具变量k的初始数值;wk是商品i的工具变量k所对应的指标的权重,即由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
然后,对概念层的初始质量信用指数进行加权,得到目标层指标的初始质量信用指数Indexi0:
其中,uj是概念层指标j的权重,即由步骤(4)计算得到;
步骤(6):利用每个工具变量类型对应的增长率算法,计算每个商品所对应指标的工具变量的原始增长率;
对应数值类型的增长率算法:
其中,i是指商品i;t是指月份t;RelativeRatioit是指商品i在t月的工具变量的原始增长率;Xit是指商品i在t月的工具变量的值,Xit-1是指商品i在(t-1)月的工具变量的值,这里的工具变量的值是指标层的每个指标所对应的工具变量值;
对应状态类型的增长率算法:
对应比例类型的增长率算法:
其中,Zit是指商品i在t月的比例类型工具变量值,Zit-1是指商品i在(t-1)月的比例类型工具变量值,这里的比例类型工具变量值是指标层的每个指标所对应的工具变量值;
步骤(7):修正原始增长率以获得修正后增长率;
根据增长率数据的数据分布情况,对增长率进行标准化,将标准化增长率作为修正增长率;增长率的取值范围是[-1,+INF],其中INF是指无穷大;
电商产品质量信用指数评价模型中的指标类型分为:流量类型指标、比例类型指标和状态类型指标;
根据工具变量对应的指标的类型,标准化增长率的方式具体为:
方式1)对于流量类型或者比例类型的指标对应的工具变量:
方式2)对于状态类型的指标对应的工具变量:
RelativeRatio′it=RelativeRatioit
步骤(8):按权重合成各变量的修正增长率,按月份更新每个商品的质量信用指数;
计算每个商品的产品质量信用指数的方法,具体为:
通过对工具变量的修正增长率数值进行加权来得到该产品当月的产品质量信用指数增长率IndexRationit:
其中,RelativeRatio′ijt是商品i的工具变量j在t月的修正增长率;wj是工具变量j在计算质量信用指数中的权重,由步骤(4)计算得到;indicators是商品i的指标层的指标对应的工具变量集合;
利用当前月份产品质量信用指数增长率对历史产品质量信用指数进行更新,得到当前月份的产品质量信用指数Indexit:
Indexit=Indexit-1*(1+IndexRatioit)
其中,Indexit-1是前一个月份的产品质量信用指数;符号“*”是指乘法运算;
步骤(9):计算每个商品的投票权,集合每个商品的产品质量信用指数及投票权来计算总体产品质量信用指数;
计算每个商品的投票权变量,具体包括下述方法步骤为:
方法步骤1):确定销量总和的占比超过市场总销量的固定百分比r的前topN商品;topN值的计算方法为:将商品销量按从大到小排序,取前topN个商品,使得这些商品的销量和大于等于市场总销量的固定百分比r;
其中,r为常数,取值范围为:10%~50%;
方法步骤2):计算集中度ratio:
其中,volumetopN为近N个月所述topN商品的销量和;N为常数,取值范围为:1~12;mean(volume)为该行业中的同类商品的平均销量;
方法步骤3):根据销量和集中度计算投票权voteit:
其中,volumeit为近M个月商品i的平均成交量;M为自然数,取值范围为1~5;voteit是商品i在t月的投票权;τ是指投票温度,取值范围为0~1,设置τ越小则销量高的商品权重越高;items是指该行业中的同类商品集合;volumekt是指商品k在t月的销量,k指商品k;符号“*”是指乘法运算;
集合每个商品的产品质量信用指数及投票权变量来计算得到当前月份的总体产品质量信用指数,公式如下:
其中,items是指该行业中的同类商品集合;L默认值为100;
计算得到的总体产品质量信用指数Indext,即为最终评价电商产品当前月份的质量信用的数据,总体产品质量信用指数的值越大,则产品质量信用越好。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810781686.0A CN109146611B (zh) | 2018-07-16 | 2018-07-16 | 一种电商产品质量评价方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810781686.0A CN109146611B (zh) | 2018-07-16 | 2018-07-16 | 一种电商产品质量评价方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109146611A CN109146611A (zh) | 2019-01-04 |
CN109146611B true CN109146611B (zh) | 2021-06-15 |
Family
ID=64800669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810781686.0A Active CN109146611B (zh) | 2018-07-16 | 2018-07-16 | 一种电商产品质量评价方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109146611B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110362660B (zh) * | 2019-07-23 | 2023-06-09 | 重庆邮电大学 | 一种基于知识图谱的电子产品质量自动检测方法 |
CN110503313A (zh) * | 2019-07-31 | 2019-11-26 | 中国计量大学 | 一种电商平台在售丝绸制品的质量评价模型 |
CN110544024A (zh) * | 2019-08-21 | 2019-12-06 | 南京莱斯信息技术股份有限公司 | 一种基于区块链的商圈信用指数评价方法 |
CN113052411A (zh) * | 2019-12-26 | 2021-06-29 | 北京邮电大学 | 数据产品质量评价方法及装置 |
CN113688120A (zh) * | 2021-08-30 | 2021-11-23 | 维沃移动通信有限公司 | 数据仓库的质量检测方法、装置和电子设备 |
CN114444986B (zh) * | 2022-04-11 | 2022-06-03 | 成都数之联科技股份有限公司 | 产品分析方法及***及装置及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424572A (zh) * | 2013-08-28 | 2015-03-18 | 国家广播电影电视总局广播科学研究院 | 一种数字家庭购物商户信用评价方法 |
CN105528465A (zh) * | 2016-02-03 | 2016-04-27 | 天弘基金管理有限公司 | 信用状况评估方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040044505A1 (en) * | 2002-09-04 | 2004-03-04 | Richard Horwitz | Method and system for identifying risk factors |
-
2018
- 2018-07-16 CN CN201810781686.0A patent/CN109146611B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424572A (zh) * | 2013-08-28 | 2015-03-18 | 国家广播电影电视总局广播科学研究院 | 一种数字家庭购物商户信用评价方法 |
CN105528465A (zh) * | 2016-02-03 | 2016-04-27 | 天弘基金管理有限公司 | 信用状况评估方法及装置 |
Non-Patent Citations (4)
Title |
---|
product quality index for concept design evaluation;Jeong JH等;《journal of korean society of manufacturing technology engineers》;20101231;全文 * |
大豆质量可追溯***构建;郑小林;《中国优秀硕士学位论文全文数据库 农业科技辑》;20131215;全文 * |
电子商务平台下农产品信用评价指标体系构建;王宸圆等;《电子商务》;20160915;全文 * |
网络书店推荐***的负效应与对策;杨金花等;《现代出版》;20170710;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109146611A (zh) | 2019-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109146611B (zh) | 一种电商产品质量评价方法及*** | |
Terblanche et al. | The influence of integrated reporting and internationalisation on intellectual capital disclosures | |
CN110704572B (zh) | 疑似非法集资风险的预警方法、装置、设备和存储介质 | |
Campbell et al. | Tone at the bottom: Measuring corporate misconduct risk from the text of employee reviews | |
Muûls et al. | Imports and Exports at the Level of the Firm: Evidence from Belgium | |
Lyócsa et al. | Default or profit scoring credit systems? Evidence from European and US peer-to-peer lending markets | |
CN110472815A (zh) | 一种供应链金融业务中对融资企业的风险控制方法及*** | |
CN116468460B (zh) | 基于人工智能的消费金融客户画像识别***及其方法 | |
Matthies et al. | Computer-aided text analysis of corporate disclosures-demonstration and evaluation of two approaches | |
CN110619462A (zh) | 一种基于ai模型的项目质量评估方法 | |
CN111105311A (zh) | 债券主体的动态信用评级方法及装置 | |
CN113763154A (zh) | 一种基于模糊灰色评价的钢贸供应链金融风险评估方法 | |
CN112419030A (zh) | 财务舞弊风险评估的方法、***及设备 | |
Bai et al. | Visualizing environmental management: Corporate environmental images information disclosure and idiosyncratic risk | |
CN111951093A (zh) | 一种个人信用分评分方法 | |
Tilimbe | Ethical implications of predictive risk intelligence | |
Chen et al. | Financial fraud detection of listed companies in china: A machine learning approach | |
CN117114812A (zh) | 一种针对企业的金融产品推荐方法及装置 | |
Singh et al. | A PCA-based fuzzy tensor evaluation model for multiple-criteria group decision making | |
Qian et al. | Product Success Evaluation Model Based on Star Ratings, Reviews and Product Popularity | |
CN111612603A (zh) | 上市公司疑似财务造假行为洞察判别*** | |
CN116151840A (zh) | 一种基于大数据的用户服务数据智能管理***及方法 | |
TWM583089U (zh) | 智慧型信用風險評估系統 | |
CN115618926A (zh) | 一种面向纳税人企业分类的重要因子提取方法及装置 | |
CN115563176A (zh) | 一种电子商务数据处理***及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |