CN109345272A - 一种基于改进马尔科夫链的店铺信用风险预测方法 - Google Patents
一种基于改进马尔科夫链的店铺信用风险预测方法 Download PDFInfo
- Publication number
- CN109345272A CN109345272A CN201811430043.8A CN201811430043A CN109345272A CN 109345272 A CN109345272 A CN 109345272A CN 201811430043 A CN201811430043 A CN 201811430043A CN 109345272 A CN109345272 A CN 109345272A
- Authority
- CN
- China
- Prior art keywords
- shop
- credit
- comment
- markovian
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000006872 improvement Effects 0.000 title claims abstract description 7
- 230000008451 emotion Effects 0.000 claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000005516 engineering process Methods 0.000 claims abstract description 6
- 238000003058 natural language processing Methods 0.000 claims abstract description 5
- 238000011156 evaluation Methods 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 239000002245 particle Substances 0.000 claims description 11
- 230000007704 transition Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000013210 evaluation model Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000009472 formulation Methods 0.000 claims description 2
- 238000009415 formwork Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 239000000463 material Substances 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000005201 scrubbing Methods 0.000 claims description 2
- 238000004140 cleaning Methods 0.000 claims 1
- 210000005036 nerve Anatomy 0.000 claims 1
- 238000013461 design Methods 0.000 abstract description 3
- 230000009193 crawling Effects 0.000 abstract 1
- 238000005457 optimization Methods 0.000 abstract 1
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000012372 quality testing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006748 scratching Methods 0.000 description 1
- 230000002393 scratching effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种基于改进马尔科夫链的店铺信用风险预测方法,具体步骤如下:1,店铺语料库获取:利用网络爬虫技术在电商平台爬取店铺详情及店铺的商品指定信息并保存到数据库中;2,中文自然语言处理:首先对店铺商品的评论文本进行预处理,然后利用中文自然语言处理工具进行情感分析,得到情感得分;3,信用风险预测:根据多维度数据融合,设计出店铺信用综合评价表,计算出每个店铺的信用得分,进一步,构建出改进的马尔科夫链模型,根据此模型完成对店铺的信用值预测,最后,根据信用值得分得到店铺的风险等级。这就为优化电子商务店铺***工作,提高监管质量和电子商务安全创造了条件。
Description
技术领域:
本发明涉及到商品质量管理领域,尤其涉及一种基于改进马尔科夫链的店铺信用风险预测方法。
背景技术:
近年来,以互联网为依托进行商品和服务交易的电子商务蓬勃发展,极大提高了经济运行的质量和效率,改变了人类的生产生活方式。2016年,全球电子商务市场规模超过25万亿美元,成为世界经济的亮点和新增长点。我国***的最新统计显示,2017年我国网络零售额达到7.18万亿元,其中实物商品的网上零售额达到5.48万亿元,网络零售对消费的拉动作用进一步增强。但是,由于电商平台质量管理模式与传统企业质量管理模式存在显著差异,现有的线下质量管理经验并不能直接被电商质量监管直接采用。近年来,质检总局把商品质量作为电子商务健康发展的生命线,积极探索包容创新的审慎监管措施,推动建立了“标准引领、风险监测、网上抽查、源头追溯、属地查处、信用管理”的电子商务商品质量监管新机制。
另据了解,目前我国正在开展的电子商务产品质量监管标准化工作涉及基础通用、质量管理、质量诚信、质量监管、质量风险防控等领域,电商质量标准体系建设有序推进。2017年12月底,质检总局和国家标准委还发布了3项电子商务方面标准,分别是《电子商务平台商家入驻审核规范》《电子商务平台产品信息展示要求》和《电子商务质量管理术语》,将在2018年内相继实施。这些标准对电子商务平台商家入驻制定了资质要求,对审核内容、结果反馈和商家信息更新等作出规定,对网络平台上产品信息展示的基本原则、展示的内容和方式提出了明确要求,让网上发布的产品信息更接近消费者的实体感受,使消费者的网购体验更真实、更安心。
电子商务在发展过程中,非常重要的一个就是信用。虚拟经济有着较快的流动速度和较高的风险,如果***出现,那么就会在较大程度上冲击到实体的贸易体系。因此,就需要充分研究电子商务信用风险。如今,国内在研究电子商务信用预测方面还处于起步阶段,通常将案例研究和定性描述方法结合应用,并未构建相关的风险预测模型。消费者在网络上很难辨识店铺是否值得信任及店铺里面商品质量是否如描述一样,因此非常容易购买到这些问题店铺的商品,如果可以通过对网络上海量的舆情数据和质量检测数据的分析,利用数据挖掘技术,对网上店铺进行信用值风险的预测,就可以有效的避免由店铺关闭、商品下架引发的各种问题。因此需要质检部门采取有效的监管措施来监督企业提高商品质量水平,同时也要加强电子商务平台的管理。
发明内容:
为了能快速、有效地从海量,多源异构的有关店铺的信息中分析出其存在的问题信用的店铺,本发明提供了一种基于改进马尔科夫链的店铺信用风险预测方法,是对传统电子商务质量管理方法的一种补充。
本发明解决其技术问题所采用的技术方案如下述内容:
一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:该方法包括下述步骤:
步骤1:语料库获取:利用网络爬虫软件,制定爬取规则,抓取与指定店铺相关的店铺信息及店铺的相关商品的评论文本,以结构化形式保存到数据库中;
步骤2:中文自然语言处理:首先对抓取的商品评论数据进行数据清理操作,然后利用中文自然语言处理工具对评论语料分别进行初次分词及词性标注、关键词及语气词的识别等预处理以获得结构化的情感分析结果并保存到数据库中,进一步,将这些关键词及语气词与词库中关键字及语气词进行对比,计算得到评论真实度值;
步骤3:信用风险预测:首先提出店铺信用综合评价表,并基于该模板计算出每个店铺的信用值;进一步,构建出改进的马尔科夫链模型,根据此模型完成对店铺的信用值预测,最后,根据信用值得分得到店铺的风险等级。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤1中,由于网络的开放性和网络评论的多元化、离散性,使得抓取的评论文本中含有大量的“噪音”,包括无效评论、垃圾评论和重复评论,这些评论都会对后续的文本分析造成重大影响,为了解决“脏”文本,必须对评论文本进行预处理。根据电商评论文本具有短字数、信息大和主体明确的特点,可以设置字数阈值和判断是否为重复字评论去除无效评论;对于垃圾评论可以判断是否含有一定的中文字数去除;最后计算评论文本的字面相似度去除重复评论。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤2中,其特征在于:用整理的情感词词典对数据库里面的商品评论提取的关键字及语气词进行对比,判断评论和给出的实际评分的差距,给定度量值3表示评论与实际评分相符,度量值1表示评论与实际评分不符,将本月所有评论的得分取平均值为该月商品评论的真实值。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,选取抓取到的店铺信息里一些关键指标,包括卖家信用、买家信用、执照信息、售后率、评论真实度,然后对这些指标进行BP神经网络训练得到它们的权重,计算店铺信用值的得分。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,店铺的总信用值得分的计算公式为:
R=Rn+Sn
其中,Rn表示C2C电子商务现有的信用评价模型,Sn表示新的信用评价模型。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,店铺总信用值得计算公式中,Rn的计算公式为:
Rn=Rn-1+rn,…rn∈{-1,0,1}
其中,Rn表示用户的当前信用度,Rn-1表示用户近期信用度,rn表示用户得到第n次信用反馈评分,rn∈{-1,0,1}。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,店铺总信用值得计算公式中,Sn的计算公式为:
Sn=α*S1+β*S2+γ*S3+δ*S4+ε*S5
其中,S1,S2,S3,S4,S5分别表示为卖家信用、买家信用、执照信息、售后率、评论真实度;α,β,γ,δ,ε分别表示各个因子对应的权重。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,计算改进的马尔科夫预测模型中,状态转移概率矩阵为:
其中,m为经过第一步分的状态数;为Ei经1步转移到指定状态Ej所出现的频数;为状态Ei所出现的总频数。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,计算改进的马尔科夫预测模型中,风险转移概率为:
其中,pn1+pn2+…+pnk=1。
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,计算改进的马尔科夫预测模型中,若某一变量初始状态Ei的初始向量为P0,则其k步状态转移概率矩阵为
Pk=(P1)k
则经过k步转移后的状态向量为
Pk=P0×Pk=Po(P1)k
在上述的一种基于改进马尔科夫链的店铺信用风险预测方法中,在所述的步骤3中,在改进的马尔科夫预测模型中,首先建立BP神经网络模型,归一化原本数据;然后用原始数据中的前三个数据预测第四个数据,将预测值与实际值向比较,求出残差值;然后归一化进行状态划分;进一步求出状态转移概率。最后用马尔科夫过程修正BP神经网络预测的结果,即计算出店铺下一个月的信用值
本发明的有益效果:利用网络爬虫工具从电商平台网站上获取海量、多源异构的店铺详细信息及店铺里面商品的使用评论文本,经过浅层、深层的中文文本信息处理技术,使得非结构化的数据变成结构化的数据,得到店铺信用综合评价,并构建店铺信用值的预测模型,进而对店铺信用值进行风险预测。这就帮助了电子商品的购买者及监测部门确定店铺的店家信用,确定未来购买的商品的交易风险,有效的避免由店铺信用引发的各种问题,建立起风险防范体系,提高了电子商务交易的安全性。
附图说明:
图1是本发明的整体流程图也是本发明的摘要附图。
图2是本发明的整体技术路线图。
图3是本发明的预处理技术路线图。
图4是其构建店铺信用得分的设计图。
图5是构建BP神经网络主要流程图。
图6是其构建马尔科夫过程主要流程图。
图7是其店铺信用风险等级划分设计图。
具体实施方式:
下面结合具体附图对本发明作进一步的说明。
本发明是通过网络爬虫工具对大型电商平台进行信息抓取,获得海量、多源异构的中文网络店铺信息及商品的用户评论文本,并对其进行中文自然语言处理,构造一个完整的店铺信用风险预测模型。
一种基于改进马尔科夫链的店铺信用风险预测方法,包括语料库获取、中文自然语言处理和信用风险预测这三个步骤,如图1所示。下面对这三个步骤分别进行详细说明。
步骤1,语料库获取:利用网络爬虫工具,从大型电商平台上采集指定店铺相关的店铺信息及店铺的相关商品的评论文本,并保存到本地数据库,然后对保存的评论信息进行预处理,降低数据中的噪音,得到真实、可靠、非结构化的评论语料库。
评论语料库获取的过程如下过程。制定网络爬虫工具的爬取规则,抓取店铺详细信息及商品的评论信息两级内容,将抓取的数据存储到本地数据库中,一部分是店铺的经营统计信息,另一部分是商品的评论信息成为原始评论文本;对其原始评论文本进行数据预处理,生成评论语料库,也存储到数据库中。
其中,由于网络的开放性和网络评论的多元化、离散性,使得从电商平台上抓取的网络评论文本中含有大量噪音,若直接对其进行文本挖掘,所得结果可能会与实际产生较大偏差。所以,为了获得符合实际的结果,需对原始评论集合进行过滤和清洗,降低噪音。预处理包括删除空白、无用的评论,删除评论中多余的标点符号,删除评论中冗余的词语,删除字数少于4字的评论、修改错别字,简体字替换繁体字、删除冗余的评论等。
步骤2,中文自然语言处理:利用中文自然语言处理工具对评论语料分别进行初次分词及词性标注、关键词及语气词的识别等预处理以获得结构化的情感分析结果并保存到数据库中,进一步,计算出这条评论的情感得分,如图3所示。
2.1)分词及词性标注
客户反馈在电商平台上的评论是以交流和共享为目的的,是文本形式的非结构化自然语言,若要从中挖掘出有价值的信息,则需通过分词技术把它转化为结构化数据。对评论语料进行分词采用的工具是ICTCLAS,对分词后的评论语料进行词性标注采用的工具也是ICTCLAS,为了提高商品特征提取的查准率,选择的词性标注方法是能标注出更具体情况的二级标注。
2.2)情感分析
通过分析海量同源异构的中文网络评论文本可知,用户反馈的评论是用户对购买的商品的使用评价,通常用形容词、名词或动词来表达自己的观点。情感词典是情感词的集合。从广义上讲,指包含感情倾向性的短语或者句子;从狭义上讲,指包含有感情倾向性的词语集合。情感词典一般包含两个部分,一个正面情感词词典和一个负面情感词词典。情感词典是文本情感分析的基础资源。中文情感词汇本体库,将情感分为7个基本大类和21个小类,分别对词语情感类别和强度进行标注,计算出每条评论的情感得分。例如一条评论文本为“还不错去年就买过今年又来了安全又好我喜欢”,提取关键词和语气词为“还不错安全好”计算得到这条评论的情感得分。
步骤3,质量风险评价:利用P2P技术,对商家的信用指数进行评估,同时结合已采集到的店铺的详细信息(如卖家信用、资格认证等),提出针对商家信用的数值化模型R;其中数据分为动态信用评价指标和静态信用评价指标。动态指标包括商家的好评率、商家售后率、买家信用、商品相符度、卖家服务态度、物流服务质量、好评数、中评数、差评数以及评论相符度。静态指标包括商家的商品价格和商家的执照信息。根据提取的数据以及相关文献调研,建立可能影响商家信用的数据如图4。
本发明综合考虑赋予上述关键指标各因子不同的权值,这里采用BP神经网络对其进行训练,开始手工设置数据项的权值,然后采用BP神经网络对权值进行训练如图5。权值S的计算对店铺信用风险预测模型的建立有很大的实际意义。
相关显著性系数的计算公式为:
x=Wjk
相关指数的计算公式为:
Rij=|(1-e-x)/(1+e-x)|
y=rij
绝对影响系数的计算公式为:
i为神经网络输入单元,i=1,…m;j为神经网络输出单元,j=1,…n;k为神经网络的隐含单元,k=1,…P,Wki为输入层神经元i和隐含层神经元k之间的权系数;Wjk为输出层神经元j和隐含层神经元k之间的权系数。
最后构建如图6马尔科夫的预测模型,根据得到的店铺信用值,以相邻前三个月的数据为训练样本预测第4个月的信用值,通过建立如图7所示的风险等级进行划分。
店铺的总信用值得分的计算公式为:
R=Rn+Sn
其中,Rn表示C2C电子商务现有的信用评价模型,Sn表示新的信用评价模型。
Rn的计算公式为:
Rn=Rn-1+rn,…rn∈{-1,0,1}
其中,Rn表示用户的当前信用度,Rn-1表示用户近期信用度,rn表示用户得到第n次信用反馈评分,rn∈{-1,0,1}。
Sn的计算公式为:
Sn=α*S1+β*S2+γ*S3+δ*S4+ε*S5
其中,S1,S2,S3,S4,S5分别表示为卖家信用、买家信用、执照信息、售后率、评论真实度;α,β,γ,δ,ε分别表示各个因子对应的权重。
在上述步骤中得到店铺信用值后进行BP神经网络-马尔科夫预测模型的构建,建立步骤主要是将上述得到的商铺信用值输入到BP神经网络预测模型中,计算出预测值和实际值的残差;利用等级状态划分法将相对残差值划分成若干状态后,根据马尔科夫性对预测值进行修正。具体步骤如以下:(1)建立BP神经网络模型,归一化原始样本数据;(2)用原始样本数据中的前3个月的数据预测第4个月的数据,依此类推,得到重组数据后,对其进行训练、验证和预测;(3)将预测值与实际值比较,求出相对残差值,归一化后进行状态划分;(4)根据1步状态转移频数求出1步状态转移概率矩阵;(5)根据C-K方程求出k步状态转移概率矩阵;(6)用马尔科夫过程修正BP神经网络预测结果.
店铺信用能代表着商家的整体店铺经营情况,可以直观的反应出电子商务的消费环境,构建这个改进的马尔科夫预测模型对店铺信用风险有重要的作用。马尔科夫链可以反映风险状态的转移概率:
其中,pn1+pn2+…+pnk=1。
状态转移概率矩阵为:
其中,m为经过第一步分的状态数;为Ei经1步转移到指定状态Ej所出现的频数;为状态Ei所出现的总频数。
在改进的马尔科夫预测模型中,若某一变量初始状态Ei的初始向量为P0,则其k步状态转移概率矩阵为:
Pk=(P1)k
则经过k步转移后的状态向量为
Pk=P0×Pk=Po(P1)k
本发明能够利用网络爬虫工具抓取大型电商平台上与指定店铺相关详细信息及店铺里面商品的用户评论文本,并对其进行一系列处理,建立合理和可操作的店铺的信用值的预测模型,进而对店铺信用值进行风险预测。利用本发明的方法,可以优化电子商务的店铺***工作,提高监管质量,可以在消费之前将风险降到最低,为电子商务安全提供有力的保障。
Claims (10)
1.一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:
步骤1:店铺语料库获取
利用网络爬虫软件,制定爬取规则,抓取与指定店铺相关的店铺信息及店铺的相关产品的评论文本,以结构化形式保存到数据库中;
步骤2:中文自然语言处理
首先对抓取的商品评论数据进行数据清理操作,然后利用中文自然语言处理工具对评论语料分别进行初次分词及词性标注、关键词及语气词的识别等预处理以获得结构化的情感分析结果并保存到数据库中,进一步,将这些关键词及语气词与词库中关键字及语气词进行对比,计算得到评论真实度值;
步骤3:信用风险预测
首先提出店铺信用综合评价表,并基于该模板计算出每个店铺的信用值;进一步,构建出改进的马尔科夫链模型,根据此模型完成对店铺的信用值预测,最后,根据信用值得分得到店铺的风险等级。
2.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:在步骤1中,爬虫技术是通过网页中的HTTP协议,把制定好的正则表达式用来采集电商网站的某店铺的详细信息及店铺内所有商品评论区的评论信息。
3.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:在步骤2中,(1)对文本数据的清理主要是对评论文本数据缺省值、文本重复和评论字数限制的预处理;(2)对提取的关键词与语气词的文本数据的情感分析。
4.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:用整理的情感词词典对数据库里面的商品评论提取的关键词及语气词进行对比,判断买家评论和给出的实际评分的差距,给定度量值3表示评论与实际评分相符,度量值1表示评论与实际评分不符,将本月所有评论的得分取平均值为该月商品评论的真实值。
5.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:选取抓取到的店铺信息里一些关键指标,包括卖家信用、买家信用、执照信息、售后率、评论真实度,然后对这些指标进行BP神经网络训练得到这些因子的权重,计算每个店铺信用值的得分。
6.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:在步骤3中,店铺的总信用值得分的计算公式为:
R=Rn+Sn
其中,Rn表示C2C电子商务现有的信用评价模型,Sn表示新的信用评价模型。
7.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:在步骤3中,店铺总信用值得计算公式中,Rn的计算公式为:
Rn=Rn-1+rn,…rn∈{-1,0,1}
其中,Rn表示用户的当前信用度,Rn-1表示用户近期信用度,rn表示用户得到第n次信用反馈评分,rn∈{-1,0,1}。
8.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:在步骤3中,店铺总信用值得计算公式中,Sn的计算公式为:
Sn=α*S1+β*S2+γ*S3+δ*S4+ε*S5
其中,S1,S2,S3,S4,S5分别表示为卖家信用、买家信用、执照信息、售后率、评论真实度;α,β,γ,δ,ε分别表示各个因子对应的权重。
9.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:计算改进的马尔科夫预测模型中,状态转移概率矩阵为:
其中,m为经过第一步分的状态数;为Ei经1步转移到指定状态Ej所出现的频数;为状态Ei所出现的总频数。
10.如权利要求1所述的一种基于改进马尔科夫链的店铺信用风险预测方法,其特征在于:在步骤三中,在改进的马尔科夫预测模型中,首先建立BP神经网络模型,归一化原本数据;然后用原始数据中的前三个数据预测第四个数据,将预测值与实际值向比较,求出残差值;然后归一化进行状态划分;进一步求出状态转移概率;最后用马尔科夫过程修正BP神经网络预测的结果,即计算出店铺下一月的预测信用值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811430043.8A CN109345272A (zh) | 2018-11-28 | 2018-11-28 | 一种基于改进马尔科夫链的店铺信用风险预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811430043.8A CN109345272A (zh) | 2018-11-28 | 2018-11-28 | 一种基于改进马尔科夫链的店铺信用风险预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109345272A true CN109345272A (zh) | 2019-02-15 |
Family
ID=65318362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811430043.8A Pending CN109345272A (zh) | 2018-11-28 | 2018-11-28 | 一种基于改进马尔科夫链的店铺信用风险预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109345272A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020942A (zh) * | 2019-04-12 | 2019-07-16 | 中电科大数据研究院有限公司 | 信用风险的预警方法、装置、设备及存储介质 |
CN111461876A (zh) * | 2020-05-07 | 2020-07-28 | 赵玉洁 | 一种基于大数据的电商信用体系管理***及方法 |
CN111861507A (zh) * | 2020-06-30 | 2020-10-30 | 成都数之联科技有限公司 | 一种用于实时分析网络餐饮店铺风险的识别方法及*** |
CN113158082A (zh) * | 2021-05-13 | 2021-07-23 | 聂佼颖 | 一种基于人工智能的媒体内容真实度分析方法 |
WO2021232856A1 (zh) * | 2020-05-21 | 2021-11-25 | 中国标准化研究院 | 基于大数据的网销商品检验抽样方法 |
CN114693188A (zh) * | 2022-05-31 | 2022-07-01 | 四川骏逸富顿科技有限公司 | 一种药品零售行业风险监管方法、***和设备 |
CN117993935A (zh) * | 2024-02-26 | 2024-05-07 | 广东汇乔科技有限公司 | 一种基于区块链的电商大数据平台 |
-
2018
- 2018-11-28 CN CN201811430043.8A patent/CN109345272A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020942A (zh) * | 2019-04-12 | 2019-07-16 | 中电科大数据研究院有限公司 | 信用风险的预警方法、装置、设备及存储介质 |
CN111461876A (zh) * | 2020-05-07 | 2020-07-28 | 赵玉洁 | 一种基于大数据的电商信用体系管理***及方法 |
WO2021232856A1 (zh) * | 2020-05-21 | 2021-11-25 | 中国标准化研究院 | 基于大数据的网销商品检验抽样方法 |
CN111861507A (zh) * | 2020-06-30 | 2020-10-30 | 成都数之联科技有限公司 | 一种用于实时分析网络餐饮店铺风险的识别方法及*** |
CN111861507B (zh) * | 2020-06-30 | 2023-10-24 | 成都数之联科技股份有限公司 | 一种用于实时分析网络餐饮店铺风险的识别方法及*** |
CN113158082A (zh) * | 2021-05-13 | 2021-07-23 | 聂佼颖 | 一种基于人工智能的媒体内容真实度分析方法 |
CN114693188A (zh) * | 2022-05-31 | 2022-07-01 | 四川骏逸富顿科技有限公司 | 一种药品零售行业风险监管方法、***和设备 |
CN117993935A (zh) * | 2024-02-26 | 2024-05-07 | 广东汇乔科技有限公司 | 一种基于区块链的电商大数据平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109345272A (zh) | 一种基于改进马尔科夫链的店铺信用风险预测方法 | |
KR101741509B1 (ko) | 뉴스의 데이터마이닝을 통한 기업 평판 분석 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 | |
Alsubari et al. | [Retracted] Development of Integrated Neural Network Model for Identification of Fake Reviews in E‐Commerce Using Multidomain Datasets | |
CN107977798B (zh) | 一种电子商务产品质量的风险评价方法 | |
CN105512687A (zh) | 训练情感分类模型和文本情感极性分析的方法及*** | |
CN108491377A (zh) | 一种基于多维度信息融合的电商产品综合评分方法 | |
CN107862343A (zh) | 基于规则和神经网络的商品评论属性级情感分类方法 | |
Shafin et al. | Product review sentiment analysis by using nlp and machine learning in bangla language | |
CN108984775B (zh) | 一种基于商品评论的舆情监控方法及*** | |
CN107886240B (zh) | 一种基于规则的跨境电商商品质量风险识别方法 | |
CN103886501B (zh) | 一种基于语义情感分析的贷后风险预警*** | |
CN111353044B (zh) | 一种基于评论的情感分析方法及*** | |
CN104123659A (zh) | 基于商品网络化基因的品牌知识产权保护平台 | |
CN104899229A (zh) | 基于群体智能的行为聚类*** | |
CN114254201A (zh) | 一种科技项目评审专家的推荐方法 | |
CN112632377B (zh) | 一种基于用户评论情感分析与矩阵分解的推荐方法 | |
Anh et al. | Extracting customer reviews from online shopping and its perspective on product design | |
Desai et al. | Business intelligence visualization using deep learning based sentiment analysis on amazon review data | |
Zhang et al. | A hybrid neural network approach for fine-grained emotion classification and computing | |
Devasia et al. | Feature extracted sentiment analysis of customer product reviews | |
Liu et al. | Age inference using a hierarchical attention neural network | |
Rana et al. | A conceptual model for decision support systems using aspect based sentiment analysis | |
Jagadeesan et al. | Twitter Sentiment Analysis with Machine Learning | |
Li et al. | Words analysis of online Chinese news headlines about trending events: a complex network perspective | |
Xie et al. | The twenty-first century of structural engineering research: A topic modeling approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190215 |
|
WD01 | Invention patent application deemed withdrawn after publication |