CN106570525A - 一种基于贝叶斯网络的在线商品评价质量评估方法 - Google Patents
一种基于贝叶斯网络的在线商品评价质量评估方法 Download PDFInfo
- Publication number
- CN106570525A CN106570525A CN201610948344.4A CN201610948344A CN106570525A CN 106570525 A CN106570525 A CN 106570525A CN 201610948344 A CN201610948344 A CN 201610948344A CN 106570525 A CN106570525 A CN 106570525A
- Authority
- CN
- China
- Prior art keywords
- evaluation
- value
- quality
- commodity
- review
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000011156 evaluation Methods 0.000 claims abstract description 305
- 239000011159 matrix material Substances 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000012552 review Methods 0.000 claims description 123
- 230000006870 function Effects 0.000 claims description 61
- 238000004422 calculation algorithm Methods 0.000 claims description 46
- 238000013442 quality metrics Methods 0.000 claims description 42
- 238000010276 construction Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 7
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 238000013441 quality evaluation Methods 0.000 claims description 6
- 241001269238 Data Species 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000004141 dimensional analysis Methods 0.000 claims description 5
- 230000008451 emotion Effects 0.000 claims description 5
- 230000002996 emotional effect Effects 0.000 claims description 5
- 230000002349 favourable effect Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012790 confirmation Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 abstract 5
- 230000001174 ascending effect Effects 0.000 description 12
- 235000015170 shellfish Nutrition 0.000 description 4
- 241000208340 Araliaceae Species 0.000 description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 235000008434 ginseng Nutrition 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 210000001015 abdomen Anatomy 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于贝叶斯网络的在线商品评价质量评估方法,属于在线商品评价及不确定性推理技术领域。本发明首先对在线商品评价数据进行规范化处理并确定在线商品评价质量度量衡量标准,得到特征值向量并构建特征值矩阵;进而获得贝叶斯网的图结构,并得到概率参数表集合;最后,对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合,根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。本发明可以为第三方平台提供重要的评价质量评估方法,并能以用户视角改善评论显示顺序,使得用户可以更便捷地查看高质量评论信息。
Description
技术领域
本发明涉及一种基于贝叶斯网络的在线商品评价质量评估方法,属于在线商品评价及不确定性推理技术领域。
背景技术
随着Web2.0的发展,网络社交领域发生了巨大的改变,进而对电子商务领域也产生了深远的影响。J.Roed(<Computer Assisted LanGuaGe LearninG>16(2–3)(2003)155–172)指出,网络用户愿意披露自己的个人信息,并真实的展示他们的观点,而J.A.CheValier,D.Mayzlin(<Journal of MarketinG Research)43(3)(2006)345–354)也指出用户观点对用户决策有很大的影响,在线商品评价对产品有着间接的口头营销作用。因此,网络用户提供的评价信息不仅促进着经济交流,也作为社交论坛,影响着用户消费行为。
然而,随着电子商务领域的迅速发展,出现了在线商品评价信息数量大、评价质量参差不齐以及充斥着大量虚假评论等问题。对用户而言,在海量评价中找到有用信息愈加困难;尽管现在许多网站会以最近评价或有用投票展示评价信息,但若以最近评价排序将导致展示给用户的新评价信息质量不稳定,而若以有用投票展示评价信息,会因为新评价投票不足,而忽略高质量低投票的评价信息。这些问题都可以归结为评价质量的评估问题。因此一个客观的在线商品评价质量评估方法可以有效地解决评价的分类、排序与显示、垃圾评论等问题,以辅助用户了解商品的真实信息,做出正确的购买决策。
目前,对评价质量有多种定义及评估方法:孟美任等(现代图书情报技术,2012(9):60-66)采用人工标注的方法对评价质量进行分类训练,采用CRFs模型对评论可信度进行了四级分类,但这种人工标注的方法需要大负荷人工工作,也存在着训练样本不足,分类信息依赖于小部分人从而导致与大多数人观点相异等问题。当前,还有一部分研究使用支持向量机(SVM)来解决质量评估问题,但无法反映评价特征的依赖关系,对于多分类问题,精度仍显不足,并且组合起来较为复杂,也有研究使用回归分析评估评价质量,但其因素属推测,实际应用受限。而对于评价质量定义,目前定义方法也存在明显缺陷,Tsur O,Rappoport A(<ICWSM>,2009)以书评为例,认为好的书评应当就书的主题、情节等方面向读者提供充分的信息,以便他们做出适当的阅读或购买决定。类似地,林煜明,王晓玲等(<软件学报>,2014,25(3):506-527)则认为高质量的、有用的评论应定义为:能具体描述单品的特征/性能等信息,辅助***做出适当决策的评论。但这些定义方式过于概念性、主观性,导致评论质量难以量化,以此定义方式建立的模型不适合用户需求等问题。因此,应以用户视角分析评价质量的影响因素,选取可以量化的指标衡量评价质量,并且能够反映评价特征之间的依赖关系,给出评价质量类别置信的度模型对评价质量进行评估。
张连文(《贝叶斯网引论》,2006)指出,贝叶斯网是一种概率网络,它是为了解决不定性和不完整性问题而提出的,是处理不确定性信息的重要工具。作为一种基于概率的不确定性推理方法,贝叶斯网络在处理不确定信息的智能化***中已经得到了重要的应用,已成功地用于医疗诊断、统计决策、专家***、学习预测等领域。这些成功的应用,充分体现了贝叶斯网络技术是一种强有力的不确定性推理方法。
本发明以用户对评价信息的有用性投票为基础,提出运用概率图模型来解决评论质量的评估问题,利用贝叶斯网络分析影响评价质量特征依赖关系,使用推理机制评估评价质量,给出了评价质量置信度,为在线商品评价质量评估提供了新的思路和技术方法。
发明内容
本发明提供了一种基于贝叶斯网络的在线商品评价质量评估方法,以用于解决在不能以用户视角分析评价质量及其影响因素之间的依赖关系、评价质量难以量化且不能给出评价质量分类置信度问题,属于在线商品评价及不确定性推理领域。
本发明的技术方案是:一种基于贝叶斯网络的在线商品评价质量评估方法,首先对在线商品评价数据进行规范化处理并确定在线商品评价质量度量衡量标准,得到特征值向量并构建特征值矩阵;进而根据特征值矩阵进行结构学习,获得贝叶斯网的图结构,并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合;最后,对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合,根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
所述基于贝叶斯网络的在线商品评价质量评估方法的具体步骤如下:
Step1、首先使用特征函数对在线商品评价数据中的含有有用性投票的评价信息进行规范化处理,再基于在线商品评价有用性投票的数量确定在线商品评价质量度量衡量标准,最终得到在线商品评价数据的特征值向量,并以在线商品评价数据的特征值向量构建特征值矩阵;
Step2、基于在线商品评价数据的特征值矩阵,进行贝叶斯网络结构学习,得到贝叶斯网的图结构;并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合,概率参数表集合与图结构构成贝叶斯网络;
Step3、按Step1对在线商品评价数据中的缺乏有用性投票的评价信息进行规范化处理,并根据Step2所得贝叶斯网络的图结构与概率参数表集合使用贝叶斯网推理算法对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合;根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
所述步骤Step1的具体步骤为:
Step1.1、在线商品评价数据是从电子商务网站获取的对商品的评价数据;一件商品包含不同或相同用户的多条评价数据,每条评价数据都包含对商品的文本评论、好评、中评或差评及评价时间、名称、价格等一组综合评价数据,其中每个分量都是一个特征,而文本评论还包含语法、语义等特征,使用特征函数集F=(f1(Reviewi),f2(Reviewi),…,fn(Reviewi))对第i条原始评价数据Reviewi(i∈Z+)进行特定整数集映射,从而对原始评价数据进行规范化处理;fj(Reviewi)(1≤j≤n,i∈Z+)为某一评价特征函数,用以将评价的某特征映射至特定整数,n为评价特征数;
所述步骤Step1.1中,特征函数集主要从以下维度分析,主要包括:
评论语法维度:指的是各种词性的数量,如名词、动词、数词、副词、形容词的数量等;
评论语义维度:反应评价中表示主观或客观性及情感特性的词,如表示程度的词、肯定或否定情感的词、观点词数等;
评价的元维度:指的是评论信息中不可再分的特征,如评价中用户的评分、商品的平均得分、评论发表时间、是否促销、价格、用户所购得商品型号、评价图片状态、确认收货距评价时间、追加图片状态、确认收货距追加评价时间等;
评论人维度:关于评价用户的特征,如是否匿名、评论人等级、购买数量等;
Step1.2、评价质量用以衡量评价的有用性,其中:
评价有用性其中i∈Z+;
评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei)),Qi=g(Ratei)为评价质量类别,定义为评价质量值,Pi(Qi|Ei=ei)为评价数据Reviewi(i∈Z+)在Qi类的概率,为概率权重值,g(Ratei)为离散函数,用于将Ratei离散化,映射到不同的评价质量值;Ei为Reviewi已知特征变量称为证据变量,ei为其取值;
将g(Ratei)并入特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi)),Reviewi(i∈Z+)为第i条有用性投票大于0的原始评价数据,评价质量值作为评价特征之一,利用评价特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi),g(Ratei))得到第i条评价特征值向量,表示为Ri=(F(Reviewi))=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi))(i∈Z+),并以此构建特征值矩阵D=[dij]m×n=(R1,R2,...,Rm)T,(i=1,2,...,m;j=1,2,...,n),m为评价数,n为评价特征数。
所述步骤Step2的具体步骤为:
Step2.1、根据步骤Step 1得出的特征值矩阵D,使用BIC评分函数来评判贝叶斯图结构G=(V,S)相对于特征值矩阵D的优劣,其中,V={X1,X2,...,Xn}为一组评价特征节点,n为G中特征节点的个数;S为有向边的集合,表示评价特征之间的直接依赖关系,如特征节点X1到X2有一条边,其代表X2的值依赖于X1,称X2为X1的子节点,X1为X2的父节点,记节点X的父节点集合为π(X),子节点集合为ch(X);下面给出BIC评分函数:
上式中,BIC(G|D)表示在当前样本为特征值矩阵D的条件下贝叶斯网结构为G的BIC评分;n为G中特征结点的个数,qi为Xi(1≤i≤n)父节点集合的最大组合值,ri为Xi的最大取值;{mijk|i=1,...,n,j=1,...,qi;k=1,...,ri}是充分统计量,为特征值矩阵D中满足Xi=k和π(Xi)=j的样本数目,其中π(Xi)=j表示节点Xi的父节点集合π(Xi)取值为j,mij*为D中满足π(Xi)=j的样本的数目,m为样本数目;BIC(<Xi,π(Xi)>|D)为Xi变量的家族BIC评分;
Step2.2、选定模型评分函数后,采用K2算法找出评分最高的网络结构,寻找图结构时,首先给定K2算法的参数,包括:一组评价特征V={X1,X2,...,Xn}、一个评价特征顺序向量ρ、每个特征节点的父节点个数上界u、评价样本数据—特征值矩阵D,K2算法从一个包含所有节点、但没有边的无边图出发,在搜索过程中,K2按顺序逐个考察ρ中的特征变量,确定其父节点,然后添加相应的边。对某一变量Xj(1≤i≤n),假设K2算法已经找到了它的一些父节点π(Xj),如果|π(Xj)|<u,即Xj的父节点个数|π(Xj)|还未达到u,那么就要继续为它寻找父节点,具体做法是,首先考虑那些在ρ中排在Xj之前、但却还不是Xj的父节点的变量,从这些变量中选出Xi,它使得新家族BIC评分Vnew达到最大,然后将Vnew与旧家族BIC评分Vold比较,如果Vnew>Vold,则把Xi添加为Xj的父节点;否则停止为Xj寻找父节点,重复这一过程,直到找到BIC评分最高的贝叶斯网结构G=(V,S);
Step2.3、得到贝叶斯网结构G后,采用最大似然估计确定贝叶斯网络N=(G,θ)的概率参数表集合θ;在G中,每个特征节点Xi(1≤i≤n)都附有一个概率参数表记为CPTi={θijk|j=1,2,...,qi;k=1,2,...,ri},θijk=P(Xi=k|π(Xi)=j)表示节点Xi(1≤i≤n)的对其父节点集合π(Xi)取值为j的概率,而θ={CPT1,CPT2,...,CPTn}={θijk|i=1,2,...,n;j=1,2,...,qi;k=1,2,...,ri},其中n为节点数量,qi为Xi父节点组合的最大值,ri为Xi的最大取值;
以特征值矩阵D作为数据样本获得在G中每个节点的参数表,详式如下:
其中,是θijk的最大似然估计,{mijk|i=1,...,n,j=1,...,qi;k=1,...,ri}是充分统计量,为D中满足Xi=k和π(Xi)=j的样本的数目,mij*为D中满足π(Xi)=j的样本的数目,ri为Xi的最大取值。
所述步骤Step3的具体步骤为:
Step3.1、首先仍以步骤Step 1所述,规范化有用性投票为零的评价信息Reviewi(i∈Z+),其中特征值已知的评价特征称为证据变量,记为向量Ei,取值为ei,未知变量为评价质量值,称为查询变量,记为Qi,Qi的不同取值代表不同的评价质量值,随后,计算后验分布Pi(Qi|Ei=ei)以评估已知Ei=ei的条件评价质量值类别为Qi的概率权重值;
Step3.2、本发明采用VE变量消元算法,简称VE算法,计算Pi(Qi|Ei=ei),i∈Z+并以二元组记录下来,其中二元组包括评价质量值、概率权重值,对评价信息进行排序以便用户能更便捷地查看高质量评价信息,使用VE算法计算Pi(Qi|Ei=ei)时,首先给定VE算法的参数,包括:步骤Step 2所得贝叶斯网络N=(G,θ)、证据变量向量Ei、证据变量向量的取值ei、查询变量Qi,根据N中的概率参数表集合θ进行概率分布相乘,得到Qi的一个函数h(Qi);最后将h(Qi)归一化,得到Pi(Qi|Ei=ei),为评价信息Reviewi(i∈Z+)的概率权重值,取最大概率权重值及所对应的评价质量值Qi,并以步骤1所定义的评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei))记录下来,作为Reviewi(i∈Z+)评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合{Quality1,Quality2,…,Qualityq},其中q∈Z+,为某一件商品的评价数量;
Step3.3、通过评价质量度量值集合{Quality1,Quality2,…,Qualityq)(q∈Z+,为一件商品的评价数量)对同一商品的评价数据进行排序,以便用户能更便捷地查看高质量评论,首先通过评价质量度量值集合{Quality1,Quality2,…,Qualityq},q∈Z+,为某商品的评价数量,对某商品评价集合按评价信息质量值进行降序排列,若评价信息质量值相同再按概率权重值降序排列以便用户能更便捷的查看高质量评论。
本发明的有益效果是:
1、与公知方法相比,本发明以有用性投票作为评价质量的度量指标,评价标准更加客观,评价质量更易被量化,有效地解决了公知方法中因所用评价质量评估标准过于主观导致的所建模型不适合用户需求的问题,为在线商品评价质量评估提供了新的思路。
2、本发明所采用的贝叶斯网基于严格的数学语言,模型建立所采用的学习算法无人工干预,不会因为个人主见影响模型结构。而许多公知方法需要人工工作进行质量的分类或评估,导致错误率高、少数人意愿对训练数据影响过大等问题,从而导致结果不够客观。因此,本发明的在线商品评价质量评估方法更具客观性。
3、本发明通过结构学习、参数学习,建立了用于评估评价质量的贝叶斯网络,评价信息特征间的依赖关系简单明晰,直观易懂,方便人们对评价质量评估模型进行交流和改善;以推理的方法计算评价质量,与人类思维方式更加相近;并且给出了评价质量置信度,可以为之后的排序、显示等提供依据;而公知的回归分析方法特征变量属猜测性质,实际应用受限,扩展性不够,且公知的SVM方法一般为二分类,无法满足多分类状况或以二分类组合满足多分类,分类质量下降等问题,并且不能给出特征的依赖关系,难以深入研究评价质量评估模型,并且不能给出质量类别所对应概率,不能对同一质量级别内的评价信息进行排序。因此,本发明所提的在线商品评价方法可读性、伸缩性更好。
总之,建立了一种基于贝叶斯网络的在线商品评价质量评估方法,评价质量衡量标准客观,符合多数用户的观点,评价特征间的依赖关系简单明晰,模型结果准确,给出了评价质量类别置信度,可有效辅助用户做出购买决策,为在线商品评价质量评估方法提供了一种新的建模和计算方式。
附图说明
图1为本发明中的流程图;
图2为本发明中实施例中与有用性投票有关的部分贝叶斯网结构图。
具体实施方式
实施例1:如图1-2所示,一种基于贝叶斯网络的在线商品评价质量评估方法,首先对在线商品评价数据进行规范化处理并确定在线商品评价质量度量衡量标准,得到特征值向量并构建特征值矩阵;进而根据特征值矩阵进行结构学习,获得贝叶斯网的图结构,并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合;最后,对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合,根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
所述基于贝叶斯网络的在线商品评价质量评估方法的具体步骤如下:
Step1、首先使用特征函数对在线商品评价数据中的含有有用性投票的评价信息进行规范化处理,再基于在线商品评价有用性投票的数量确定在线商品评价质量度量衡量标准,最终得到在线商品评价数据的特征值向量,并以在线商品评价数据的特征值向量构建特征值矩阵;
Step2、基于在线商品评价数据的特征值矩阵,进行贝叶斯网络结构学习,得到贝叶斯网的图结构;并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合,概率参数表集合与图结构构成贝叶斯网络;
Step3、按Step1对在线商品评价数据中的缺乏有用性投票的评价信息进行规范化处理,并根据Step2所得贝叶斯网络的图结构与概率参数表集合使用贝叶斯网推理算法对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合;根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
实施例2:如图1-2所示,一种基于贝叶斯网络的在线商品评价质量评估方法,本实施例与实施例1相同,其中:
所述步骤Step1的具体步骤为:
Step1.1、在线商品评价数据是从电子商务网站获取的对商品的评价数据;一件商品包含不同或相同用户的多条评价数据,每条评价数据都包含对商品的文本评论、好评、中评或差评及评价时间、名称、价格等一组综合评价数据,其中每个分量都是一个特征,而文本评论还包含语法、语义等特征,使用特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi))对第i条原始评价数据Reviewi(i∈Z+)进行特定整数集映射,从而对原始评价数据进行规范化处理;fj(Reviewi)(1≤j≤n,i∈Z+)为某一评价特征函数,用以将评价的某特征映射至特定整数,n为评价特征数;
所述步骤Step1.1中,特征函数集主要从以下维度分析,主要包括:
评论语法维度:指的是各种词性的数量,如名词、动词、数词、副词、形容词的数量等;
评论语义维度:反应评价中表示主观或客观性及情感特性的词,如表示程度的词、肯定或否定情感的词、观点词数等;
评价的元维度:指的是评论信息中不可再分的特征,如评价中用户的评分、商品的平均得分、评论发表时间、是否促销、价格、用户所购得商品型号、评价图片状态、确认收货距评价时间、追加图片状态、确认收货距追加评价时间等;
评论人维度:关于评价用户的特征,如是否匿名、评论人等级、购买数量等;
Step1.2、评价质量用以衡量评价的有用性,其中:
评价有用性其中i∈Z+;
评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei)),Qi=g(Ratei)为评价质量类别,定义为评价质量值,Pi(Qi|Ei=ei)为评价数据Reviewi(i∈Z+)在Qi类的概率,为概率权重值,g(Ratei)为离散函数,用于将Ratei离散化,映射到不同的评价质量值;Ei为Reviewi已知特征变量称为证据变量,ei为其取值;
将g(Ratei)并入特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi)),Reviewi(i∈Z+)为第i条有用性投票大于0的原始评价数据,评价质量值作为评价特征之一,利用评价特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi),g(Ratei))得到第i条评价特征值向量,表示为Ri=(F(Reviewi))=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi))(i∈Z+),并以此构建特征值矩阵D=[dij]m×n=(R1,R2,...,Rm)T,(i=1,2,...,m;j=1,2,...,n),m为评价数,n为评价特征数。
实施例3:如图1-2所示,一种基于贝叶斯网络的在线商品评价质量评估方法,本实施例与实施例2相同,其中:
所述步骤Step2的具体步骤为:
Step2.1、根据步骤Step 1得出的特征值矩阵D,使用BIC评分函数来评判贝叶斯图结构G=(V,S)相对于特征值矩阵D的优劣,其中,V={X1,X2,...,Xn}为一组评价特征节点,n为G中特征节点的个数;S为有向边的集合,表示评价特征之间的直接依赖关系,如特征节点X1到X2有一条边,其代表X2的值依赖于X1,称X2为X1的子节点,X1为X2的父节点,记节点X的父节点集合为π(X),子节点集合为ch(X);下面给出BIC评分函数:
上式中,BIC(G|D)表示在当前样本为特征值矩阵D的条件下贝叶斯网结构为G的BIC评分;n为G中特征结点的个数,qi为Xi(1≤i≤n)父节点集合的最大组合值,ri为Xi的最大取值;{mijk|i=1,...,n,j=1,…,qi;k=1,…,ri}是充分统计量,为特征值矩阵D中满足Xi=k和π(Xi)=j的样本数目,其中π(Xi)=j表示节点Xi的父节点集合π(Xi)取值为j,mij*为D中满足π(Xi)=j的样本的数目,m为样本数目;BIC(<Xi,π(Xi)>|D)为Xi变量的家族BIC评分;
Step2.2、选定模型评分函数后,采用K2算法找出评分最高的网络结构,寻找图结构时,首先给定K2算法的参数,包括:一组评价特征V={X1,X2,...,Xn}、一个评价特征顺序向量ρ、每个特征节点的父节点个数上界u、评价样本数据—特征值矩阵D,K2算法从一个包含所有节点、但没有边的无边图出发,在搜索过程中,K2按顺序逐个考察ρ中的特征变量,确定其父节点,然后添加相应的边。对某一变量Xj(1≤i≤n),假设K2算法已经找到了它的一些父节点π(Xj),如果|π(Xj)|<u,即Xj的父节点个数|π(Xj)|还未达到u,那么就要继续为它寻找父节点,具体做法是,首先考虑那些在ρ中排在Xj之前、但却还不是Xj的父节点的变量,从这些变量中选出Xi,它使得新家族BIC评分Vnew达到最大,然后将Vnew与旧家族BIC评分Vold比较,如果Vnew>Vold,则把Xi添加为Xj的父节点;否则停止为Xj寻找父节点,重复这一过程,直到找到BIC评分最高的贝叶斯网结构G=(V,S);
Step2.3、得到贝叶斯网结构G后,采用最大似然估计确定贝叶斯网络N=(G,θ)的概率参数表集合θ;在G中,每个特征节点Xi(1≤i≤n)都附有一个概率参数表记为CPTi={θijk|j=1,2,...,qi;k=1,2,...,ri},θijk=P(Xi=k|π(Xi)=j)表示节点Xi(1≤i≤n)的对其父节点集合π(Xi)取值为j的概率,而θ={CPT1,CPT2,...,CPTn}={θijk|i=1,2,...,n;j=1,2,...,qi;k=1,2,...,ri},其中n为节点数量,qi为Xi父节点组合的最大值,ri为Xi的最大取值;
以特征值矩阵D作为数据样本获得在G中每个节点的参数表,详式如下:
其中,是θijk的最大似然估计,{mijk|i=1,...,n,j=1,...,qi;k=1,...,ri}是充分统计量,为D中满足Xi=k和π(Xi)=j的样本的数目,mij*为D中满足π(Xi)=j的样本的数目,ri为Xi的最大取值。
实施例4:如图1-2所示,一种基于贝叶斯网络的在线商品评价质量评估方法,首先对在线商品评价数据进行规范化处理并确定在线商品评价质量度量衡量标准,得到特征值向量并构建特征值矩阵;进而根据特征值矩阵进行结构学习,获得贝叶斯网的图结构,并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合;最后,对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合,根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
所述基于贝叶斯网络的在线商品评价质量评估方法的具体步骤如下:
Step1、首先使用特征函数对在线商品评价数据中的含有有用性投票的评价信息进行规范化处理,再基于在线商品评价有用性投票的数量确定在线商品评价质量度量衡量标准,最终得到在线商品评价数据的特征值向量,并以在线商品评价数据的特征值向量构建特征值矩阵;
Step2、基于在线商品评价数据的特征值矩阵,进行贝叶斯网络结构学习,得到贝叶斯网的图结构;并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合,概率参数表集合与图结构构成贝叶斯网络;
Step3、按Step1对在线商品评价数据中的缺乏有用性投票的评价信息进行规范化处理,并根据Step2所得贝叶斯网络的图结构与概率参数表集合使用贝叶斯网推理算法对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合;根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
所述步骤Step1的具体步骤为:
Step1.1、在线商品评价数据是从电子商务网站获取的对商品的评价数据;一件商品包含不同或相同用户的多条评价数据,每条评价数据都包含对商品的文本评论、好评、中评或差评及评价时间、名称、价格等一组综合评价数据,其中每个分量都是一个特征,而文本评论还包含语法、语义等特征,使用特征函数集F=(f1(Reviewi),f2(Reviewi),…,fn(Reviewi))对第i条原始评价数据Reviewi(i∈Z+)进行特定整数集映射,从而对原始评价数据进行规范化处理;fj(Reviewi)(1≤j≤n,i∈Z+)为某一评价特征函数,用以将评价的某特征映射至特定整数,n为评价特征数;
所述步骤Step1.1中,特征函数集主要从以下维度分析,主要包括:
评论语法维度:指的是各种词性的数量,如名词、动词、数词、副词、形容词的数量等;
评论语义维度:反应评价中表示主观或客观性及情感特性的词,如表示程度的词、肯定或否定情感的词、观点词数等;
评价的元维度:指的是评论信息中不可再分的特征,如评价中用户的评分、商品的平均得分、评论发表时间、是否促销、价格、用户所购得商品型号、评价图片状态、确认收货距评价时间、追加图片状态、确认收货距追加评价时间等;
评论人维度:关于评价用户的特征,如是否匿名、评论人等级、购买数量等;
Step1.2、评价质量用以衡量评价的有用性,其中:
评价有用性其中i∈Z+;
评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei)),Qi=g(Ratei)为评价质量类别,定义为评价质量值,Pi(Qi|Ei=ei)为评价数据Reviewi(i∈Z+)在Qi类的概率,为概率权重值,g(Ratei)为离散函数,用于将Ratei离散化,映射到不同的评价质量值;Ei为Reviewi已知特征变量称为证据变量,ei为其取值;
将g(Ratei)并入特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi)),Reviewi(i∈Z+)为第i条有用性投票大于0的原始评价数据,评价质量值作为评价特征之一,利用评价特征函数集F=(f1(Reviewi),f2(Reviewi),…,fn(Reviewi),g(Ratei))得到第i条评价特征值向量,表示为Ri=(F(Reviewi))=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi))(i∈Z+),并以此构建特征值矩阵D=[dij]m×n=(R1,R2,...,Rm)T,(i=1,2,...,m;j=1,2,...,n),m为评价数,n为评价特征数。
所述步骤Step2的具体步骤为:
Step2.1、根据步骤Step 1得出的特征值矩阵D,使用BIC评分函数来评判贝叶斯图结构G=(V,S)相对于特征值矩阵D的优劣,其中,V={X1,X2,...,Xn}为一组评价特征节点,n为G中特征节点的个数;S为有向边的集合,表示评价特征之间的直接依赖关系,如特征节点X1到X2有一条边,其代表X2的值依赖于X1,称X2为X1的子节点,X1为X2的父节点,记节点X的父节点集合为π(X),子节点集合为ch(X);下面给出BIC评分函数:
上式中,BIC(G|D)表示在当前样本为特征值矩阵D的条件下贝叶斯网结构为G的BIC评分;n为G中特征结点的个数,qi为Xi(1≤i≤n)父节点集合的最大组合值,ri为Xi的最大取值;{mijk|i=1,...,n,j=1,...,qi;k=1,...,ri}是充分统计量,为特征值矩阵D中满足Xi=k和π(Xi)=j的样本数目,其中π(Xi)=j表示节点Xi的父节点集合π(Xi)取值为j,mij*为D中满足π(Xi)=j的样本的数目,m为样本数目;BIC(<Xi,π(Xi)>|D)为Xi变量的家族BIC评分;
Step2.2、选定模型评分函数后,采用K2算法找出评分最高的网络结构,寻找图结构时,首先给定K2算法的参数,包括:一组评价特征V={X1,X2,…,Xn}、一个评价特征顺序向量ρ、每个特征节点的父节点个数上界u、评价样本数据—特征值矩阵D,K2算法从一个包含所有节点、但没有边的无边图出发,在搜索过程中,K2按顺序逐个考察ρ中的特征变量,确定其父节点,然后添加相应的边。对某一变量Xj(1≤i≤n),假设K2算法已经找到了它的一些父节点π(Xj),如果|π(Xj)|<u,即Xj的父节点个数|π(Xj)|还未达到u,那么就要继续为它寻找父节点,具体做法是,首先考虑那些在ρ中排在Xj之前、但却还不是Xj的父节点的变量,从这些变量中选出Xi,它使得新家族BIC评分Vnew达到最大,然后将Vnew与旧家族BIC评分Vold比较,如果Vnew>Vold,则把Xi添加为Xj的父节点;否则停止为Xj寻找父节点,重复这一过程,直到找到BIC评分最高的贝叶斯网结构G=(V,S);
Step2.3、得到贝叶斯网结构G后,采用最大似然估计确定贝叶斯网络N=(G,θ)的概率参数表集合θ;在G中,每个特征节点Xi(1≤i≤n)都附有一个概率参数表记为CPTi={θijk|j=1,2,...,qi;k=1,2,...,ri},θijk=P(Xi=k|π(Xi)=j)表示节点Xi(1≤i≤n)的对其父节点集合π(Xi)取值为j的概率,而θ={CPT1,CPT2,...,CPTn}={θijk|i=1,2,...,n;j=1,2,...,qi;k=1,2,...,ri},其中n为节点数量,qi为Xi父节点组合的最大值,ri为Xi的最大取值;
以特征值矩阵D作为数据样本获得在G中每个节点的参数表,详式如下:
其中,是θijk的最大似然估计,{mijk|i=1,...,n,j=1,...,qi;k=1,...,ri}是充分统计量,为D中满足Xi=k和π(Xi)=j的样本的数目,mij*为D中满足π(Xi)=j的样本的数目,ri为Xi的最大取值。
所述步骤Step3的具体步骤为:
Step3.1、首先仍以步骤Step 1所述,规范化有用性投票为零的评价信息Reviewi(i∈Z+),其中特征值已知的评价特征称为证据变量,记为向量Ei,取值为ei,未知变量为评价质量值,称为查询变量,记为Qi,Qi的不同取值代表不同的评价质量值,随后,计算后验分布Pi(Qi|Ei=ei)以评估已知Ei=ei的条件评价质量值类别为Qi的概率权重值;
Step3.2、本发明采用VE变量消元算法,简称VE算法,计算Pi(Qi|Ei=ei),i∈Z+并以二元组记录下来,其中二元组包括评价质量值、概率权重值,对评价信息进行排序以便用户能更便捷地查看高质量评价信息,使用VE算法计算Pi(Qi|Ei=ei)时,首先给定VE算法的参数,包括:步骤Step 2所得贝叶斯网络N=(G,θ)、证据变量向量Ei、证据变量向量的取值ei、查询变量Qi,根据N中的概率参数表集合θ进行概率分布相乘,得到Qi的一个函数h(Qi);最后将h(Qi)归一化,得到Pi(Qi|Ei=ei),为评价信息Reviewi(i∈Z+)的概率权重值,取最大概率权重值及所对应的评价质量值Qi,并以步骤1所定义的评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei))记录下来,作为Reviewi(i∈Z+)评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合{Quality1,Quality2,…,Qualityq},其中q∈Z+,为某一件商品的评价数量;
Step3.3、通过评价质量度量值集合{Quality1,Quality2,…,Qualityq)(q∈Z+,为一件商品的评价数量)对同一商品的评价数据进行排序,以便用户能更便捷地查看高质量评论,首先通过评价质量度量值集合{Quality1,Quality2,…,Qualityq},q∈Z+,为某商品的评价数量,对某商品评价集合按评价信息质量值进行降序排列,若评价信息质量值相同再按概率权重值降序排列以便用户能更便捷的查看高质量评论。
实施例5:如图1-2所示,一种基于贝叶斯网络的在线商品评价质量评估方法,首先对在线商品评价数据进行规范化处理并确定在线商品评价质量度量衡量标准,得到特征值向量并构建特征值矩阵;进而根据特征值矩阵进行结构学习,获得贝叶斯网的图结构,并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合;最后,对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合,根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
所述基于贝叶斯网络的在线商品评价质量评估方法的具体步骤如下:
Step1、首先使用特征函数对在线商品评价数据中的含有有用性投票的评价信息进行规范化处理,再基于在线商品评价有用性投票的数量确定在线商品评价质量度量衡量标准,最终得到在线商品评价数据的特征值向量,并以在线商品评价数据的特征值向量构建特征值矩阵;
Step2、基于在线商品评价数据的特征值矩阵,进行贝叶斯网络结构学习,得到贝叶斯网的图结构;并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合,概率参数表集合与图结构构成贝叶斯网络;
Step3、按Step1对在线商品评价数据中的缺乏有用性投票的评价信息进行规范化处理,并根据Step2所得贝叶斯网络的图结构与概率参数表集合使用贝叶斯网推理算法对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合;根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
所述步骤Step1的具体步骤为:
Step1.1、在线商品评价数据是从电子商务网站获取的对商品的评价数据;一件商品包含不同或相同用户的多条评价数据,每条评价数据都包含对商品的文本评论、好评、中评或差评及评价时间、名称、价格等一组综合评价数据,其中每个分量都是一个特征,而文本评论还包含语法、语义等特征,使用特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi))对第i条原始评价数据Reviewi(i∈Z+)进行特定整数集映射,从而对原始评价数据进行规范化处理;fj(Reviewi)(1≤j≤n,i∈Z+)为某一评价特征函数,用以将评价的某特征映射至特定整数,n为评价特征数;其中,n为8;
所述步骤Step1.1中,特征函数集主要从以下维度分析,主要包括:
评论语法维度:指的是各种词性的数量,如名词、动词、数词、副词、形容词的数量等;
评论语义维度:反应评价中表示主观或客观性及情感特性的词,如表示程度的词、肯定或否定情感的词、观点词数等;
评价的元维度:指的是评论信息中不可再分的特征,如评价中用户的评分、商品的平均得分、评论发表时间、是否促销、价格、用户所购得商品型号、评价图片状态、确认收货距评价时间、追加图片状态、确认收货距追加评价时间等;
评论人维度:关于评价用户的特征,如是否匿名、评论人等级、购买数量等;
具体的:
1.1、八个特征函数意义分别为:是否含有追加评论,追加评论距确认收货天数,评论距确认收货天数,是否匿名,评论中的名词数,评论中的动词数,评论中的副词数,评论长度。
如是否含有追加评论函数f1(Reviewi)为离散变量取值为“False”、“True”,映射到“1”、“2”;再如评论长度为连续变量,先将评论长度升序排列,将评论长度映射为以下整数值:
1:评论长度升序排列后位于评价数据前20%的评论长度值;
2:评论长度升序排列后位于评价数据21%~40%的评论长度值;
3:评论长度升序排列后位于评价数据41%~60%的评论长度值;
4:评论长度升序排列后位于评价数据61%~80%的评论长度值;
5:评论长度升序排列后位于评价数据剩余部分的评论长度值;
若不同比例间有相同评论长度值,则将相同评论长度值归并到前一比例内。其他特征函数的映射规则与之类似。
Step1.2、评价质量用以衡量评价的有用性,其中:
评价有用性其中i∈Z+;
评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei)),Qi=g(Ratei)为评价质量类别,定义为评价质量值,Pi(Qi|Ei=ei)为评价数据Reviewi(i∈Z+)在Qi类的概率,为概率权重值,g(Ratei)为离散函数,用于将Ratei离散化,映射到不同的评价质量值;Ei为Reviewi已知特征变量称为证据变量,ei为其取值;
将g(Ratei)并入特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi)),Reviewi(i∈Z+)为第i条有用性投票大于0的原始评价数据,评价质量值作为评价特征之一,利用评价特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi),g(Ratei))得到第i条评价特征值向量,表示为Ri=(F(Reviewi))=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi))(i∈Z+),并以此构建特征值矩阵D=[dij]m×n=(R1,R2,...,Rm)T,(i=1,2,...,m;j=1,2,...,n),m为评价数,n为评价特征数。
具体的:
1.2基于(评价有用性)与(评价质量度量值),将评价质量值划为6级,评价质量中g(Ratei)的映射规则如下:
1:评价Rate值升序排列后位于评价数据前16.67%的评价Rate值
2:评价Rate值升序排列后位于评价数据16.68%~33.34%的评价Rate值
3:评价Rate值升序排列后位于评价数据33.35%~50.01%的评价Rate值
4:评价Rate值升序排列后位于评价数据50.02%~66.68%的评价Rate值
5:评价Rate值升序排列后位于评价数据66.69%~83.35%的评价Rate值
6:评价Rate值升序排列后位于评价数据剩余部分的评价Rate值
若不同比例间有相同Rate值,则将相同Rate值归并到前一比例内。将g(Ratei)函数并入(f1(Reviewi),f2(Reviewi),...,f8(Reviewi))得特征函数集向量F=(f1(Reviewi),f2(Reviewi),...,f9(Reviewi))。如现有有用性投票大于零的评价信息Review1=(True,18,0,True,5,22,0,7,2),将其规范化后得R1=(1,1,1,2,1,5,1,1,2)。
同理得:
R2=(2,4,1,1,2,2,2,3,2);
R3=(2,4,1,1,2,2,2,5,3);
……
R2000=(2,4,1,1,2,3,3,6,2)
以评价特征值向量构建评价特征值矩阵D=(R1,R2,…,R2000)T。
所述步骤Step2的具体步骤为:
Step2.1、根据步骤Step 1得出的特征值矩阵D,使用BIC评分函数来评判贝叶斯图结构G=(V,S)相对于特征值矩阵D的优劣,其中,V={X1,X2,…,Xn}为一组评价特征节点,n为G中特征节点的个数;S为有向边的集合,表示评价特征之间的直接依赖关系,如特征节点X1到X2有一条边,其代表X2的值依赖于X1,称X2为X1的子节点,X1为X2的父节点,记节点X的父节点集合为π(X),子节点集合为ch(X);下面给出BIC评分函数:
上式中,BIC(G|D)表示在当前样本为特征值矩阵D的条件下贝叶斯网结构为G的BIC评分;n为G中特征结点的个数,qi为Xi(1≤i≤n)父节点集合的最大组合值,ri为Xi的最大取值;{mijk|i=1,…,n,j=1,...,qi;k=1,...,ri}是充分统计量,为特征值矩阵D中满足Xi=k和π(Xi)=j的样本数目,其中π(Xi)=j表示节点Xi的父节点集合π(Xi)取值为j,mij*为D中满足π(Xi)=j的样本的数目,m为样本数目;BIC(<Xi,π(Xi)>|D)为Xi变量的家族BIC评分;
Step2.2、选定模型评分函数后,采用K2算法找出评分最高的网络结构,寻找图结构时,首先给定K2算法的参数,包括:一组评价特征V={X1,X2,...,Xn}、一个评价特征顺序向量ρ、每个特征节点的父节点个数上界u、评价样本数据—特征值矩阵D,K2算法从一个包含所有节点、但没有边的无边图出发,在搜索过程中,K2按顺序逐个考察ρ中的特征变量,确定其父节点,然后添加相应的边。对某一变量Xj(1≤i≤n),假设K2算法已经找到了它的一些父节点π(Xj),如果|π(Xj)|<u,即Xj的父节点个数|π(Xj)|还未达到u,那么就要继续为它寻找父节点,具体做法是,首先考虑那些在ρ中排在Xj之前、但却还不是Xj的父节点的变量,从这些变量中选出Xi,它使得新家族BIC评分Vnew达到最大,然后将Vnew与旧家族BIC评分Vold比较,如果Vnew>Vold,则把Xi添加为Xj的父节点;否则停止为Xj寻找父节点,重复这一过程,直到找到BIC评分最高的贝叶斯网结构G=(V,S);
Step2.3、得到贝叶斯网结构G后,采用最大似然估计确定贝叶斯网络N=(G,θ)的概率参数表集合θ;在G中,每个特征节点Xi(1≤i≤n)都附有一个概率参数表记为CPTi={θijk|j=1,2,...,qi;k=1,2,...,ri},θijk=P(Xi=k|π(Xi)=j)表示节点Xi(1≤i≤n)的对其父节点集合π(Xi)取值为j的概率,而θ={CPT1,CPT2,...,CPTn}={θijk|i=1,2,...,n;j=1,2,...,qi;k=1,2,...,ri},其中n为节点数量,qi为Xi父节点组合的最大值,ri为Xi的最大取值;
以特征值矩阵D作为数据样本获得在G中每个节点的参数表,详式如下:
其中,是θijk的最大似然估计,{mijk|i=1,...,n,j=1,...,qi;k=1,...,ri}是充分统计量,为D中满足Xi=k和π(Xi)=j的样本的数目,mij*为D中满足π(Xi)=j的样本的数目,ri为Xi的最大取值。
具体的步骤为:
2.1根据步骤Step 1得出的特征值矩阵D,按K2算法和BIC评分函数来寻找贝叶斯图结构G。首先给定K2函数的参数V={X1,X2,…,X9},ρ=(4,3,2,7,6,5,1,8,9),u=9,D=(R1,R2,…,R2000)T,通过K2算法和BIC评分函数输出贝叶斯网图结构G,如图2所示:其中,图2中:
结点1:代表特征“是否含有追加评论”
结点2:代表特征“追加评论距确认收货时间”
结点3:代表特征“评论距确认收货时间”
结点4:代表特征“是否匿名”
结点5:代表特征“评论中的名词数”
结点6:代表特征“评论中的动词数”
结点7:代表特征“评论中的副词数”
结点8:代表特征“评论长度”
结点9:代表特征“评价质量值”
2.2利用步骤Step 1所得的特征值矩阵D、步骤2.1得到的G以及式(2)进行参数学习,得到每个节点的概率表。以结点X6为例,结点X6取值为1、2、3、4、5、6,有1个父结点X5取值范围为1、2、3、4、5、6,则结点X6的概率表共36个概率值,如表1所示。
表1
类似地,其他每个结点都有一张类似的参数表,最后组成概率参数表集合θ。
所述步骤Step3的具体步骤为:
Step3.1、首先仍以步骤Step 1所述,规范化有用性投票为零的评价信息Reviewi(i∈Z+),其中特征值已知的评价特征称为证据变量,记为向量Ei,取值为ei,未知变量为评价质量值,称为查询变量,记为Qi,Qi的不同取值代表不同的评价质量值,随后,计算后验分布Pi(Qi|Ei=ei)以评估已知Ei=ei的条件评价质量值类别为Qi的概率权重值;
Step3.2、本发明采用VE变量消元算法,简称VE算法,计算Pi(Qi|Ei=ei),i∈Z+并以二元组记录下来,其中二元组包括评价质量值、概率权重值,对评价信息进行排序以便用户能更便捷地查看高质量评价信息,使用VE算法计算Pi(Qi|Ei=ei)时,首先给定VE算法的参数,包括:步骤Step 2所得贝叶斯网络N=(G,θ)、证据变量向量Ei、证据变量向量的取值ei、查询变量Qi,根据N中的概率参数表集合θ进行概率分布相乘,得到Qi的一个函数h(Qi);最后将h(Qi)归一化,得到Pi(Qi|Ei=ei),为评价信息Reviewi(i∈Z+)的概率权重值,取最大概率权重值及所对应的评价质量值Qi,并以步骤1所定义的评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei))记录下来,作为Reviewi(i∈Z+)评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合{Quality1,Quality2,…,Qualityq},其中q∈Z+,为某一件商品的评价数量;
Step3.3、通过评价质量度量值集合{Quality1,Quality2,…,Qualityq)(q∈Z+,为一件商品的评价数量)对同一商品的评价数据进行排序,以便用户能更便捷地查看高质量评论,首先通过评价质量度量值集合{Quality1,Quality2,…,Qualityq},q∈Z+,为某商品的评价数量,对某商品评价集合按评价信息质量值进行降序排列,若评价信息质量值相同再按概率权重值降序排列以便用户能更便捷的查看高质量评论。
Step3.1-Step3.3具体的为:
以缺乏投票的一条评价信息Rl1=(2,4,1,1,2,2,2,5,[]),为例,[]为推理项。使用算VE变量消元算法对Rl1评价质量进行推理,首先输入VE变量消元算法包括:步骤Step 2所得的叶斯网络N=(G,θ)、El1={X1,X2,…,X8}、el1={2,4,1,1,2,2,2,5}、Ql1=X9,输出X9概率分布,如表2所示:
表2
Ql1 | Pl(Ql|El=el) |
1 | 0.00% |
2 | 69.93% |
3 | 20.44% |
4 | 7.30% |
5 | 2.32% |
6 | 0.00% |
可以看到,其评价质量值在第二级别的可能性最大,因此,将Ql1=2作为此评价信息的评价质量值,再将其概率权重值Pl1(Ql1|El1=el1)=0.699记录下来,因此Qualityl1=(2,0.699),同理Rl2=(2,4,1,1,2,1,1,3,[])、Rl3=(2,4,1,1,2,2,2,5,[])Quality值分别为(2,0.723)、(3,0.819)。排序时,Rl1、Rl2、Rl3按评价质量值降序排序为Rl3、Rl1、Rl2,而Rl1、Rl2评价质量值相同,再按其质量值所对应的概率权重值降序排序为Rl3、Rl2、Rl1,所得排序结果可使用户便捷地查看高质量评论信息。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (5)
1.一种基于贝叶斯网络的在线商品评价质量评估方法,其特征在于:首先对在线商品评价数据进行规范化处理并确定在线商品评价质量度量衡量标准,得到特征值向量并构建特征值矩阵;进而根据特征值矩阵进行结构学习,获得贝叶斯网的图结构,并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合;最后,对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合,根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
2.根据权利要求1所述的基于贝叶斯网络的在线商品评价质量评估方法,其特征在于:所述基于贝叶斯网络的在线商品评价质量评估方法的具体步骤如下:
Step1、首先使用特征函数对在线商品评价数据中的含有有用性投票的评价信息进行规范化处理,再基于在线商品评价有用性投票的数量确定在线商品评价质量度量衡量标准,最终得到在线商品评价数据的特征值向量,并以在线商品评价数据的特征值向量构建特征值矩阵;
Step2、基于在线商品评价数据的特征值矩阵,进行贝叶斯网络结构学习,得到贝叶斯网的图结构;并根据图结构进行贝叶斯网络参数学习,得到概率参数表集合,概率参数表集合与图结构构成贝叶斯网络;
Step3、按Step1对在线商品评价数据中的缺乏有用性投票的评价信息进行规范化处理,并根据Step2所得贝叶斯网络的图结构与概率参数表集合使用贝叶斯网推理算法对评价质量值进行概率推理,取最大概率权重值及对应的评价质量值,最终得到评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合;根据评价质量度量值对同一商品的评价数据进行排序,得到评估结果。
3.根据权利要求2所述的基于贝叶斯网络的在线商品评价质量评估方法,其特征在于:所述步骤Step1的具体步骤为:
Step1.1、在线商品评价数据是从电子商务网站获取的对商品的评价数据;一件商品包含不同或相同用户的多条评价数据,每条评价数据都包含对商品的文本评论、好评、中评或差评及评价时间、名称、价格等一组综合评价数据,其中每个分量都是一个特征,而文本评论还包含语法、语义等特征,使用特征函数集F=(f1(Reviewi),f2(Reviewi),…,fn(Reviewi))对第i条原始评价数据Reviewi(i∈Z+)进行特定整数集映射,从而对原始评价数据进行规范化处理;fj(Reviewi)(1≤j≤n,i∈Z+)为某一评价特征函数,用以将评价的某特征映射至特定整数,n为评价特征数;
所述步骤Step1.1中,特征函数集主要从以下维度分析,主要包括:
评论语法维度:指的是各种词性的数量,如名词、动词、数词、副词、形容词的数量等;
评论语义维度:反应评价中表示主观或客观性及情感特性的词,如表示程度的词、肯定或否定情感的词、观点词数等;
评价的元维度:指的是评论信息中不可再分的特征,如评价中用户的评分、商品的平均得分、评论发表时间、是否促销、价格、用户所购得商品型号、评价图片状态、确认收货距评价时间、追加图片状态、确认收货距追加评价时间等;
评论人维度:关于评价用户的特征,如是否匿名、评论人等级、购买数量等;
Step1.2、评价质量用以衡量评价的有用性,其中:
评价有用性其中i∈Z+;
评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei)),Qi=g(Ratei)为评价质量类别,定义为评价质量值,Pi(Qi|Ei=ei)为评价数据Reviewi(i∈Z+)在Qi类的概率,为概率权重值,g(Ratei)为离散函数,用于将Ratei离散化,映射到不同的评价质量值;Ei为Reviewi已知特征变量称为证据变量,ei为其取值;
将g(Ratei)并入特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi)),Reviewi(i∈Z+)为第i条有用性投票大于0的原始评价数据,评价质量值作为评价特征之一,利用评价特征函数集F=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi),g(Ratei))得到第i条评价特征值向量,表示为Ri=(F(Reviewi))=(f1(Reviewi),f2(Reviewi),...,fn(Reviewi))(i∈Z+),并以此构建特征值矩阵D=[dij]m×n=(R1,R2,...,Rm)T,(i=1,2,...,m;j=1,2,...,n),m为评价数,n为评价特征数。
4.根据权利要求2所述的基于贝叶斯网络的在线商品评价质量评估方法,其特征在于:所述步骤Step2的具体步骤为:
Step2.1、根据步骤Step 1得出的特征值矩阵D,使用BIC评分函数来评判贝叶斯图结构G=(V,S)相对于特征值矩阵D的优劣,其中,V={X1,X2,...,Xn}为一组评价特征节点,n为G中特征节点的个数;S为有向边的集合,表示评价特征之间的直接依赖关系,如特征节点X1到X2有一条边,其代表X2的值依赖于X1,称X2为X1的子节点,X1为X2的父节点,记节点X的父节点集合为π(X),子节点集合为ch(X);下面给出BIC评分函数:
上式中,BIC(G|D)表示在当前样本为特征值矩阵D的条件下贝叶斯网结构为G的BIC评分;n为G中特征结点的个数,qi为Xi(1≤i≤n)父节点集合的最大组合值,ri为Xi的最大取值;{mijk|i=1,...,n,j=1,…,qi;k=1,...,ri}是充分统计量,为特征值矩阵D中满足Xi=k和π(Xi)=j的样本数目,其中π(Xi)=j表示节点Xi的父节点集合π(Xi)取值为j,mij*为D中满足π(Xi)=j的样本的数目,m为样本数目;BIC(<Xi,π(Xi)>|D)为Xi变量的家族BIC评分;
Step2.2、选定模型评分函数后,采用K2算法找出评分最高的网络结构,寻找图结构时,首先给定K2算法的参数,包括:一组评价特征V={X1,X2,...,Xn}、一个评价特征顺序向量ρ、每个特征节点的父节点个数上界u、评价样本数据—特征值矩阵D,K2算法从一个包含所有节点、但没有边的无边图出发,在搜索过程中,K2按顺序逐个考察ρ中的特征变量,确定其父节点,然后添加相应的边。对某一变量Xj(1≤i≤n),假设K2算法已经找到了它的一些父节点π(Xj),如果|π(Xj)|<u,即Xj的父节点个数|π(Xj)|还未达到u,那么就要继续为它寻找父节点,具体做法是,首先考虑那些在ρ中排在Xj之前、但却还不是Xj的父节点的变量,从这些变量中选出Xi,它使得新家族BIC评分Vnew达到最大,然后将Vnew与旧家族BIC评分Vold比较,如果Vnew>Vold,则把Xi添加为Xj的父节点;否则停止为Xj寻找父节点,重复这一过程,直到找到BIC评分最高的贝叶斯网结构G=(V,S);
Step2.3、得到贝叶斯网结构G后,采用最大似然估计确定贝叶斯网络N=(G,θ)的概率参数表集合θ;在G中,每个特征节点Xi(1≤i≤n)都附有一个概率参数表记为CPTi={θijk|j=1,2,...,qi;k=1,2,...,ri},θijk=P(Xi=k|π(Xi)=j)表示节点Xi(1≤i≤n)的对其父节点集合π(Xi)取值为j的概率,而θ={CPT1,CPT2,...,CPTn}={θijk|i=1,2,...,n;j=1,2,...,qi;k=1,2,...,ri},其中n为节点数量,qi为Xi父节点组合的最大值,ri为Xi的最大取值;
以特征值矩阵D作为数据样本获得在G中每个节点的参数表,详式如下:
其中,是θijk的最大似然估计,{mijk|i=1,...,n,j=1,...,qi;k=1,...,ri}是充分统计量,为D中满足Xi=k和π(Xi)=j的样本的数目,mij*为D中满足π(Xi)=j的样本的数目,ri为Xi的最大取值。
5.根据权利要求2所述的基于贝叶斯网络的在线商品评价质量评估方法,其特征在于:所述步骤Step3的具体步骤为:
Step3.1、首先仍以步骤Step 1所述,规范化有用性投票为零的评价信息Reviewi(i∈Z+),其中特征值已知的评价特征称为证据变量,记为向量Ei,取值为ei,未知变量为评价质量值,称为查询变量,记为Qi,Qi的不同取值代表不同的评价质量值,随后,计算后验分布Pi(Qi|Ei=ei)以评估已知Ei=ei的条件评价质量值类别为Qi的概率权重值;
Step3.2、本发明采用VE变量消元算法,简称VE算法,计算Pi(Qi|Ei=ei),i∈Z+并以二元组记录下来,其中二元组包括评价质量值、概率权重值,对评价信息进行排序以便用户能更便捷地查看高质量评价信息,使用VE算法计算Pi(Qi|Ei=ei)时,首先给定VE算法的参数,包括:步骤Step 2所得贝叶斯网络N=(G,θ)、证据变量向量Ei、证据变量向量的取值ei、查询变量Qi,根据N中的概率参数表集合θ进行概率分布相乘,得到Qi的一个函数h(Qi);最后将h(Qi)归一化,得到Pi(Qi|Ei=ei),为评价信息Reviewi(i∈Z+)的概率权重值,取最大概率权重值及所对应的评价质量值Qi,并以步骤1所定义的评价质量度量值Qualityi=(Qi,Pi(Qi|Ei=ei))记录下来,作为Reviewi(i∈Z+)评价质量度量值,以同一商品的评价质量度量值构建评价质量度量值集合{Quality1,Quality2,…,Qualityq},其中q∈Z+,为某一件商品的评价数量;
Step3.3、通过评价质量度量值集合{Quality1,Quality2,…,Qualityq)(q∈Z+,为一件商品的评价数量)对同一商品的评价数据进行排序,以便用户能更便捷地查看高质量评论,首先通过评价质量度量值集合{Quality1,Quality2,…,Qualityq},q∈Z+,为某商品的评价数量,对某商品评价集合按评价信息质量值进行降序排列,若评价信息质量值相同再按概率权重值降序排列以便用户能更便捷的查看高质量评论。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610948344.4A CN106570525A (zh) | 2016-10-26 | 2016-10-26 | 一种基于贝叶斯网络的在线商品评价质量评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610948344.4A CN106570525A (zh) | 2016-10-26 | 2016-10-26 | 一种基于贝叶斯网络的在线商品评价质量评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106570525A true CN106570525A (zh) | 2017-04-19 |
Family
ID=58534986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610948344.4A Pending CN106570525A (zh) | 2016-10-26 | 2016-10-26 | 一种基于贝叶斯网络的在线商品评价质量评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106570525A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107491491A (zh) * | 2017-07-20 | 2017-12-19 | 西南财经大学 | 一种适应用户兴趣变化的媒体文章推荐方法 |
CN107730306A (zh) * | 2017-09-26 | 2018-02-23 | 云南大学 | 基于多维偏好模型的电影评分预测与偏好估计方法 |
CN107808324A (zh) * | 2017-10-20 | 2018-03-16 | 西安电子科技大学 | 一种在线商品的信誉值计算方法、网络交易平台、计算机 |
CN108154380A (zh) * | 2017-04-28 | 2018-06-12 | 华侨大学 | 基于大规模评分数据对用户进行商品在线实时推荐的方法 |
CN108229826A (zh) * | 2018-01-04 | 2018-06-29 | 中国计量大学 | 一种基于改进贝叶斯算法的网购风险等级评估方法 |
CN108363790A (zh) * | 2018-02-12 | 2018-08-03 | 百度在线网络技术(北京)有限公司 | 用于对评论进行评估的方法、装置、设备和存储介质 |
CN108399249A (zh) * | 2018-03-02 | 2018-08-14 | 上海精数信息科技有限公司 | 数据归一化方法、用户画像提供方法、设备及存储介质 |
CN108446858A (zh) * | 2018-03-27 | 2018-08-24 | 中国航空无线电电子研究所 | 基于特定网络结构的空地威胁评估方法 |
CN108550065A (zh) * | 2018-04-10 | 2018-09-18 | 百度在线网络技术(北京)有限公司 | 评论数据处理方法、装置及设备 |
CN108763233A (zh) * | 2017-04-21 | 2018-11-06 | 北京京东尚科信息技术有限公司 | 基于大数据的疑似假货商品识别及分类的方法和装置 |
CN108874832A (zh) * | 2017-05-15 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 目标评论确定方法及装置 |
CN110728131A (zh) * | 2018-06-29 | 2020-01-24 | 北京京东尚科信息技术有限公司 | 一种分析文本属性的方法和装置 |
CN111859301A (zh) * | 2020-07-23 | 2020-10-30 | 广西大学 | 基于改进Apriori算法和贝叶斯网络推理的数据可靠性评价方法 |
CN112435651A (zh) * | 2020-11-20 | 2021-03-02 | 昆明学院 | 一种语音数据自动标注的质量评估方法 |
CN112597376A (zh) * | 2020-12-16 | 2021-04-02 | 北京五八信息技术有限公司 | 信息查询方法及装置 |
CN113052411A (zh) * | 2019-12-26 | 2021-06-29 | 北京邮电大学 | 数据产品质量评价方法及装置 |
CN114925308A (zh) * | 2022-04-29 | 2022-08-19 | 北京百度网讯科技有限公司 | 网站的网页处理方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908019A (zh) * | 2010-07-30 | 2010-12-08 | 南开大学 | 一种基于贝叶斯网络的网构软件可信性评估模型 |
CN104217251A (zh) * | 2014-08-12 | 2014-12-17 | 西北工业大学 | 基于k2算法的装备故障贝叶斯网络预测方法 |
CN104881796A (zh) * | 2015-05-16 | 2015-09-02 | 成都数联铭品科技有限公司 | 基于评价内容和id识别的虚假评价判断*** |
CN105608634A (zh) * | 2015-11-09 | 2016-05-25 | 国网新疆电力公司 | 一种基于贝叶斯网络的电网风险预警评估模型 |
-
2016
- 2016-10-26 CN CN201610948344.4A patent/CN106570525A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908019A (zh) * | 2010-07-30 | 2010-12-08 | 南开大学 | 一种基于贝叶斯网络的网构软件可信性评估模型 |
CN104217251A (zh) * | 2014-08-12 | 2014-12-17 | 西北工业大学 | 基于k2算法的装备故障贝叶斯网络预测方法 |
CN104881796A (zh) * | 2015-05-16 | 2015-09-02 | 成都数联铭品科技有限公司 | 基于评价内容和id识别的虚假评价判断*** |
CN105608634A (zh) * | 2015-11-09 | 2016-05-25 | 国网新疆电力公司 | 一种基于贝叶斯网络的电网风险预警评估模型 |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763233A (zh) * | 2017-04-21 | 2018-11-06 | 北京京东尚科信息技术有限公司 | 基于大数据的疑似假货商品识别及分类的方法和装置 |
CN108154380A (zh) * | 2017-04-28 | 2018-06-12 | 华侨大学 | 基于大规模评分数据对用户进行商品在线实时推荐的方法 |
CN108874832A (zh) * | 2017-05-15 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 目标评论确定方法及装置 |
CN107491491A (zh) * | 2017-07-20 | 2017-12-19 | 西南财经大学 | 一种适应用户兴趣变化的媒体文章推荐方法 |
CN107730306A (zh) * | 2017-09-26 | 2018-02-23 | 云南大学 | 基于多维偏好模型的电影评分预测与偏好估计方法 |
CN107730306B (zh) * | 2017-09-26 | 2021-02-02 | 云南大学 | 基于多维偏好模型的电影评分预测与偏好估计方法 |
CN107808324A (zh) * | 2017-10-20 | 2018-03-16 | 西安电子科技大学 | 一种在线商品的信誉值计算方法、网络交易平台、计算机 |
CN107808324B (zh) * | 2017-10-20 | 2021-05-28 | 西安电子科技大学 | 一种在线商品的信誉值计算方法、网络交易平台、计算机 |
CN108229826A (zh) * | 2018-01-04 | 2018-06-29 | 中国计量大学 | 一种基于改进贝叶斯算法的网购风险等级评估方法 |
WO2019153737A1 (zh) * | 2018-02-12 | 2019-08-15 | 百度在线网络技术(北京)有限公司 | 用于对评论进行评估的方法、装置、设备和存储介质 |
CN108363790A (zh) * | 2018-02-12 | 2018-08-03 | 百度在线网络技术(北京)有限公司 | 用于对评论进行评估的方法、装置、设备和存储介质 |
US11403680B2 (en) | 2018-02-12 | 2022-08-02 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method, apparatus for evaluating review, device and storage medium |
CN108399249A (zh) * | 2018-03-02 | 2018-08-14 | 上海精数信息科技有限公司 | 数据归一化方法、用户画像提供方法、设备及存储介质 |
CN108446858A (zh) * | 2018-03-27 | 2018-08-24 | 中国航空无线电电子研究所 | 基于特定网络结构的空地威胁评估方法 |
CN108446858B (zh) * | 2018-03-27 | 2022-03-08 | 中国航空无线电电子研究所 | 基于特定网络结构的空地威胁评估方法 |
CN108550065A (zh) * | 2018-04-10 | 2018-09-18 | 百度在线网络技术(北京)有限公司 | 评论数据处理方法、装置及设备 |
CN108550065B (zh) * | 2018-04-10 | 2022-10-18 | 百度在线网络技术(北京)有限公司 | 评论数据处理方法、装置及设备 |
CN110728131A (zh) * | 2018-06-29 | 2020-01-24 | 北京京东尚科信息技术有限公司 | 一种分析文本属性的方法和装置 |
CN113052411A (zh) * | 2019-12-26 | 2021-06-29 | 北京邮电大学 | 数据产品质量评价方法及装置 |
CN111859301A (zh) * | 2020-07-23 | 2020-10-30 | 广西大学 | 基于改进Apriori算法和贝叶斯网络推理的数据可靠性评价方法 |
CN111859301B (zh) * | 2020-07-23 | 2024-02-02 | 广西大学 | 基于改进Apriori算法和贝叶斯网络推理的数据可靠性评价方法 |
CN112435651A (zh) * | 2020-11-20 | 2021-03-02 | 昆明学院 | 一种语音数据自动标注的质量评估方法 |
CN112435651B (zh) * | 2020-11-20 | 2023-05-02 | 昆明学院 | 一种语音数据自动标注的质量评估方法 |
CN112597376A (zh) * | 2020-12-16 | 2021-04-02 | 北京五八信息技术有限公司 | 信息查询方法及装置 |
CN114925308A (zh) * | 2022-04-29 | 2022-08-19 | 北京百度网讯科技有限公司 | 网站的网页处理方法、装置、电子设备和存储介质 |
CN114925308B (zh) * | 2022-04-29 | 2023-10-03 | 北京百度网讯科技有限公司 | 网站的网页处理方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570525A (zh) | 一种基于贝叶斯网络的在线商品评价质量评估方法 | |
TWI598755B (zh) | 資料分析系統、資料分析方法、內儲資料分析程式的電腦程式產品及內儲資料分析程式的記錄媒體 | |
CN103927675B (zh) | 判断用户年龄段的方法及装置 | |
Chen | A signed-distance-based approach to importance assessment and multi-criteria group decision analysis based on interval type-2 fuzzy set | |
CN111831905B (zh) | 基于团队科研影响力及可持续性建模的推荐方法和装置 | |
CN108363790A (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
Zhang et al. | When are influentials equally influenceable? The strength of strong ties in new product adoption | |
CN106504015A (zh) | 一种结合bp神经网络的企业领域供应商推荐方法 | |
Cho et al. | A loss function approach to group preference aggregation in the AHP | |
CN102314489B (zh) | 网络论坛中舆论领袖分析方法 | |
Fang | Intelligent online English teaching system based on SVM algorithm and complex network | |
Kabak et al. | A cumulative belief degree-based approach for missing values in nuclear safeguards evaluation | |
CN106097204A (zh) | 一种面向冷启动学生用户的工作推荐***及推荐方法 | |
CN109299380A (zh) | 在线教育平台中基于多维特征的习题个性化推荐方法 | |
Ma et al. | A credit risk assessment model of borrowers in P2P lending based on BP neural network | |
CN106469395A (zh) | 一种数据商品动态综合评估方法及*** | |
CN110751355A (zh) | 一种科技成果评估方法和装置 | |
CN103577876A (zh) | 基于前馈神经网络的可信与不可信用户识别方法 | |
CN106202377A (zh) | 一种基于随机梯度下降的在线协同排序方法 | |
CN110717654A (zh) | 基于用户评论的产品质量评价方法和*** | |
Zhu et al. | Identifying the technology convergence using patent text information: A graph convolutional networks (GCN)-based approach | |
CN107610009A (zh) | 一种基于神经网络的三位一体招生录取概率预测方法 | |
CN112668822A (zh) | 科技成果转化平台共享***、方法、存储介质、手机app | |
CN109885776A (zh) | 开源社区pr评审者可解释推荐模型 | |
CN107992613A (zh) | 一种基于机器学习的文本挖掘技术消费维权指标分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170419 |
|
RJ01 | Rejection of invention patent application after publication |