CN109614982A - 产品分析方法、装置、计算机设备以及存储介质 - Google Patents
产品分析方法、装置、计算机设备以及存储介质 Download PDFInfo
- Publication number
- CN109614982A CN109614982A CN201811213732.3A CN201811213732A CN109614982A CN 109614982 A CN109614982 A CN 109614982A CN 201811213732 A CN201811213732 A CN 201811213732A CN 109614982 A CN109614982 A CN 109614982A
- Authority
- CN
- China
- Prior art keywords
- characteristic information
- user
- data
- feature vector
- user data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 32
- 238000007635 classification algorithm Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 25
- 239000000284 extract Substances 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012827 research and development Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种产品分析方法、装置、计算机设备以及存储介质,其中,所述方法包括:获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。本发明实施例能够提前预知产品在市场中的表现,并且提高新产品或者有潜力产品的研发能力,从而增加企业的盈利。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种产品分析方法、装置、计算机设备以及存储介质。
背景技术
随着各类金融产品的增加,对于金融产品的市场受欢迎度并没有一个完整、合理的分析过程,比如,对于借款产品,若无法分析某一借款产品在市场中的受欢迎度,便会导致无法对借款产品加大投入以获取市场盈利,另外,由于无法提前预知哪款产品在市场中的表现,也会进一步影响新产品或者有潜力产品的研发,从而影响企业的盈利。
发明内容
有鉴于此,本发明实施例提供一种产品分析方法、装置、计算机设备以及存储介质,能够提前预知产品在市场中的表现,并且提高新产品或者有潜力产品的研发能力,从而增加企业的盈利。
一方面,本发明实施例提供了一种产品分析方法,该方法包括:
获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;
提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;
对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;
将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;
获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。
另一方面,本发明实施例提供了一种产品分析装置,所述装置包括:
第一获取单元,用于获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;
提取单元,用于提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;
转换单元,用于对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;
训练单元,用于将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;
执行单元,用于获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。
又一方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的产品分析方法。
再一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行,以实现如上所述的产品分析方法。
本发明实施例提供一种产品分析方法、装置、计算机设备以及存储介质,其中方法包括:获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。本发明实施例能够提前预知产品在市场中的表现,并且提高新产品或者有潜力产品的研发能力,从而增加企业的盈利。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种产品分析方法的示意流程图;
图2是本发明实施例提供的一种产品分析方法的原理示意图;
图3是本发明实施例提供的一种产品分析方法的示意流程图;
图4是本发明实施例提供的一种产品分析装置的示意性框图;
图5是本发明实施例提供的一种产品分析装置的另一示意性框图;
图6是本发明实施例提供的一种产品分析装置的另一示意性框图;
图7是本发明实施例提供的一种计算机设备的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
请参阅图1,图1为本发明实施例提供的一种产品分析方法的示意流程图。该方法可以运行在智能手机(如Android手机、IOS手机等)、平板电脑、笔记本电脑以及智能设备等终端中。图1是本发明实施例提供的产品分析方法的示意流程图。如图1所示,该方法包括步骤S101~S105。
S101,获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中。
在本发明实施例中,通过终端上的应用APP获取所述用户数据,例如,当用户申请借款时,需要通过终端上相应的借款APP填写用户的个人信息,所填写的用户的个人信息包括用户身份信息、用户年龄、借款金额、用户的职业、用户的年收入情况以及抵押物的评估金额等等。所述预设数据库可以是MySQL数据库,本实施例通过连接MySQL数据库将应用APP上的用户数据存储至MySQL数据库中,可选的,可以通过JDBC(Java DataBaseConnectivity,java数据库连接)方式连接MySQL数据库,确定MySQL数据库中用于存储用户数据的数据表或者创建相应的数据表用于存储用户数据;连接MySQL数据库的方法可以具体为在开发环境(如MyEclipse环境)中加载MySQL数据库的JDBC驱动程序,在开发程序中通过Class.forName函数(指定数据库的驱动程序的函数)来加载并添加该JDBC驱动程序;通过DriverManager类创建MySQL数据库连接对象Connection,DriverManager类作用于开发程序和JDBC驱动程序之间,用于检查所加载的驱动程序是否可以建立连接,然后通过DriverManager类的getConnection方法,根据MySQL数据库的URL链接、用户名和密码,创建一个JDBC Connection对象,其中,URL链接的格式为协议名+IP地址(域名)+端口+数据库名称,用户名和密码指的是登录MySQL数据库时所使用的用户名和密码;通过Connection对象的createStatement()方法创建一个Statement对象,该Statement对象用于执行静态SQL语句并返回它所生成结果的对象;调用Statement对象的相关方法执行相对应的SQL语句,最后通过Connection的close()方法及时关闭数据连接。
S102,提取所述预设数据库中的用户数据并确定所述用户数据的特征信息。
在本发明实施例中,该特征信息是指可以用于朴素贝叶斯分类算法训练并生成相应模型所需的待分析用户数据,并且在该特征信息训练并生成模型的过程中将作为变量进行使用,该特征信息是与对应产品有关的多个维度的待分析用户数据,具体地,该特征信息可以包括但不限于用户身份信息、用户年龄、借款金额、用户的职业、用户的年收入情况以及抵押物的评估金额等等。
进一步地,请参阅图2,所述步骤S102包括步骤S202~S204。
S202,获取所述用户数据中的用户属性关键词。
在本发明实施例中,所述用户属性关键词指的是用于指示用户数据中特征信息的字符串,该用户属性关键词一般写在特征信息前端并起到指示或者解释的作用,例如,对于用户数据为用户身份信息,其在数据库中以字段“用户身份:XXX…XXX”存储于相应的数据表中,在该字段中用户属性关键词为“用户身份”,对于用户数据为用户年龄,其在数据库中以字段“年龄:XX”存储于相应的数据表中,在该字段中用户属性关键词为“年龄”等等。
S204,确定所述用户属性关键词所指示的特征信息,并提取所确定的特征信息。
在本发明实施例中,在用户数据中,所述特征信息作为用户属性关键词的属性值,通常为数字,该特征信息一般跟在用户属性关键词后面并显示用户属性关键词对应的属性值,例如,对于用户数据为用户身份信息,其在数据库中以字段“用户身份:XXX…XXX”存储于相应的数据表中,在该字段中特征信息为“XXX…XXX”,对于用户数据为用户年龄,其在数据库中以字段“年龄:XX”存储于相应的数据表中,在该字段中特征信息为“XX”等等。
S103,对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量。
在本发明实施例中,针对不同类别的用户数据对特征信息进行分类,在分类之前需要预先存储各类别的特征信息表,所分类的特征信息会根据预先存储的类别特征信息表进行划分。
需要说明的是,所述特征信息的类别包含身份信息类、年龄类、借款金额类、个人职业类、个人年收入情况类以及个人抵押物的预估金额类等等。不同的类别对应不同的特征信息,例如,身份信息类对应用户身份信息,年龄类对应用户年龄,借款金额类对应用户的借款金额数量等等。
进一步地,请参阅图3,所述步骤S103包括步骤S302~S306。
S302,根据预先存储的各类别的类别特征信息,确定所述待分类的特征信息所对应的类别。
在本发明实施例中,通过预先存储各类别对应的类别特征信息,可以判断预先存储的类别特征信息中,是否存在与所确定的特征信息相对应的类别,如果存在,可以根据预先存储的类别特征信息对所确定的特征信息进行分类,若不存在,可以通过其它方式来判断所确定的特征信息所属的类别,具体的,若不存在,可以将所确定的特征信息作为一个新类,在预先存储的类别特征信息中增加该新类。
S304,根据所对应的类别对所述待分类的特征信息进行分类。
S306,根据预设向量空间模型将已分类的特征信息进行转换得到已分类的特征向量。
在本发明实施例中,在本发明实施例中,将所确定的特征信息进行向量空间模型处理,以把特征信息处理简化为向量空间中的向量运算,例如,全部的特征信息为k1,k2,...,km,其中k1,k2,km分别表示不同的特征信息,则每个特征信息可以表示为如表1所示:
表1
k<sub>1</sub> | k<sub>2</sub> | ... | k<sub>m</sub> | |
Y<sub>1</sub> | Y<sub>11</sub> | Y<sub>12</sub> | ... | Y<sub>1m</sub> |
... | ... | ... | ||
Y<sub>n</sub> | Y<sub>n1</sub> | Y<sub>n2</sub> | ... | Y<sub>nm</sub> |
其中,Yij表示特征信息的权重,1≤i≤n,1≤j≤m,特征信息的权重可以通过有序二元比较量化法进行确定,k1...km表示m个特征向量。
需要说明的是,所述有序二元比较量化法将x个目标特征信息进行二元比较重要性定性排序,经过一致性检验判断与调整得到排序一致性二元对比标度矩阵E,根据标度矩阵E各行元素值之和,从大到小排列,得到关于优的排序次数,再以排序第1位的目标作为标准,与其他目标进行重要性程度的比较,可得非归一化目标权向量w′=w′1,w′2,...,w′p,然后进行归一化计算,即可得目标权向量式w=w1,w2,...,wp,以满足
S104,将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库。
在本发明实施例中,所述预设朴素贝叶斯分类算法模型为:其中,设A={a1,a2,...,am}为待分析的特征向量集合,每个a为特征向量集合X的特征向量,C={C1,C2,....,Cn}为待分析的特征向量的分类集合。计算p(C|A)的具体步骤包括:统计待分析的特征向量分类集合中各特征向量的条件概率:p(a1|C1),p(a2|C2),...,p(am|Cn);根据朴素贝叶斯定理将所统计的各特征向量的条件概率作为朴素贝叶斯定理的训练数据进行输入,并得到各特征向量的模型库。
S105,获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。
在本发明实施例中,可以从指定用户所输入的指定用户数据中提取多维度的特征信息,所提取的多维度的特征信息的数目可以由用户自行决定,在此不作限制,例如所提取的多维度的特征信息可以是100个,将所提取的多维度的特征信息构成对应的测试样本,并且多个多维度的特征信息构成样本集,根据该样本集构成测试集,具体地,可以对指定用户的指定用户数据进行多次提取,每次提取的多个多维度特征信息构成一个样本集,多次提取的多个多维度特征信息构成多个样本集,多个样本集构建成多个测试集;将所构成的一个测试集或者多个测试集作为输入数据,输入朴素贝叶斯分类算法模型库中进行分析,根据朴素贝叶斯分类算法模型库的分析结果,分别针对不同的用户匹配出不同的产品并显示在终端中以供用户选择或者参考。
由以上可见,本发明实施例通过获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。本发明实施例能够提前预知产品在市场中的表现,并且提高新产品或者有潜力产品的研发能力,从而增加企业的盈利。
请参阅图4,对应上述一种产品分析方法,本发明实施例还提出一种产品分析装置,该装置100包括:第一获取单元101、提取单元102、转换单元103、训练单元104、执行单元105。
其中,所述第一获取单元101,用于获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中。在本发明实施例中,通过终端上的应用APP获取所述用户数据,例如,当用户申请借款时,需要通过终端上相应的借款APP填写用户的个人信息,所填写的用户的个人信息包括用户身份信息、用户年龄、借款金额、用户的职业、用户的年收入情况以及抵押物的评估金额等等。所述预设数据库可以是MySQL数据库,本实施例通过连接MySQL数据库将应用APP上的用户数据存储至MySQL数据库中,可选的,可以通过JDBC(JavaDataBase Connectivity,java数据库连接)方式连接MySQL数据库,确定MySQL数据库中用于存储用户数据的数据表或者创建相应的数据表用于存储用户数据;连接MySQL数据库的方法可以具体为在开发环境(如MyEclipse环境)中加载MySQL数据库的JDBC驱动程序,在开发程序中通过Class.forName函数(指定数据库的驱动程序的函数)来加载并添加该JDBC驱动程序;通过DriverManager类创建MySQL数据库连接对象Connection,DriverManager类作用于开发程序和JDBC驱动程序之间,用于检查所加载的驱动程序是否可以建立连接,然后通过DriverManager类的getConnection方法,根据MySQL数据库的URL链接、用户名和密码,创建一个JDBC Connection对象,其中,URL链接的格式为协议名+IP地址(域名)+端口+数据库名称,用户名和密码指的是登录MySQL数据库时所使用的用户名和密码;通过Connection对象的createStatement()方法创建一个Statement对象,该Statement对象用于执行静态SQL语句并返回它所生成结果的对象;调用Statement对象的相关方法执行相对应的SQL语句,最后通过Connection的close()方法及时关闭数据连接。
提取单元102,用于提取所述预设数据库中的用户数据并确定所述用户数据的特征信息。在本发明实施例中,该特征信息是指可以用于朴素贝叶斯分类算法训练并生成相应模型所需的待分析用户数据,并且在该特征信息训练并生成模型的过程中将作为变量进行使用,该特征信息是与对应产品有关的多个维度的待分析用户数据,具体地,该特征信息可以包括但不限于用户身份信息、用户年龄、借款金额、用户的职业、用户的年收入情况以及抵押物的评估金额等等。
转换单元103,用于对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量。在本发明实施例中,针对不同类别的用户数据对特征信息进行分类,在分类之前需要预先存储各类别的特征信息表,所分类的特征信息会根据预先存储的类别特征信息表进行划分。需要说明的是,所述特征信息的类别包含身份信息类、年龄类、借款金额类、个人职业类、个人年收入情况类以及个人抵押物的预估金额类等等。不同的类别对应不同的特征信息,例如,身份信息类对应用户身份信息,年龄类对应用户年龄,借款金额类对应用户的借款金额数量等等。
训练单元104,用于将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库。在本发明实施例中,所述预设朴素贝叶斯分类算法模型为:其中,设A={a1,a2,...,am}为待分析的特征向量集合,每个a为特征向量集合X的特征向量,C={C1,C2,....,Cn}为待分析的特征向量的分类集合。计算p(C|A)的具体步骤包括:统计待分析的特征向量分类集合中各特征向量的条件概率:p(a1|C1),p(a2|C2),…,p(am|Cn);根据朴素贝叶斯定理将所统计的各特征向量的条件概率作为朴素贝叶斯定理的训练数据进行输入,并得到各特征向量的模型库。
执行单元105,用于获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。在本发明实施例中,可以从指定用户所输入的指定用户数据中提取多维度的特征信息,所提取的多维度的特征信息的数目可以由用户自行决定,在此不作限制,例如所提取的多维度的特征信息可以是100个,将所提取的多维度的特征信息构成对应的测试样本,并且多个多维度的特征信息构成样本集,根据该样本集构成测试集,具体地,可以对指定用户的指定用户数据进行多次提取,每次提取的多个多维度特征信息构成一个样本集,多次提取的多个多维度特征信息构成多个样本集,多个样本集构建成多个测试集;将所构成的一个测试集或者多个测试集作为输入数据,输入朴素贝叶斯分类算法模型库中进行分析,根据朴素贝叶斯分类算法模型库的分析结果,分别针对不同的用户匹配出不同的产品并显示在终端中以供用户选择或者参考。
由以上可见,本发明实施例通过获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。本发明实施例能够提前预知产品在市场中的表现,并且提高新产品或者有潜力产品的研发能力,从而增加企业的盈利。
如图5所示,所述提取单元102,包括:
第二获取单元102a,用于获取所述用户数据中的用户属性关键词。在本发明实施例中,所述用户属性关键词指的是用于指示用户数据中特征信息的字符串,该用户属性关键词一般写在特征信息前端并起到指示或者解释的作用,例如,对于用户数据为用户身份信息,其在数据库中以字段“用户身份:XXX…XXX”存储于相应的数据表中,在该字段中用户属性关键词为“用户身份”,对于用户数据为用户年龄,其在数据库中以字段“年龄:XX”存储于相应的数据表中,在该字段中用户属性关键词为“年龄”等等。
提取子单元102b,用于确定所述用户属性关键词所指示的特征信息,并提取所确定的特征信息。在本发明实施例中,在用户数据中,所述特征信息作为用户属性关键词的属性值,通常为数字,该特征信息一般跟在用户属性关键词后面并显示用户属性关键词对应的属性值,例如,对于用户数据为用户身份信息,其在数据库中以字段“用户身份:XXX...XXX”存储于相应的数据表中,在该字段中特征信息为“XXX...XXX”,对于用户数据为用户年龄,其在数据库中以字段“年龄:XX”存储于相应的数据表中,在该字段中特征信息为“XX”等等。
如图6所示,所述转换单元103,包括:
确定单元103a,用于根据预先存储的各类别的类别特征信息,确定所述待分类的特征信息所对应的类别。在本发明实施例中,通过预先存储各类别对应的类别特征信息,可以判断预先存储的类别特征信息中,是否存在与所确定的特征信息相对应的类别,如果存在,可以根据预先存储的类别特征信息对所确定的特征信息进行分类,若不存在,可以通过其它方式来判断所确定的特征信息所属的类别,具体的,若不存在,可以将所确定的特征信息作为一个新类,在预先存储的类别特征信息中增加该新类。
分类单元103b,用于根据所对应的类别对所述待分类的特征信息进行分类。
转换子单元103c,用于根据预设向量空间模型将已分类的特征信息进行转换得到已分类的特征向量。在本发明实施例中,在本发明实施例中,将所确定的特征信息进行向量空间模型处理,以把特征信息处理简化为向量空间中的向量运算,例如,全部的特征信息为k1,k2,...,km,其中k1,k2,km分别表示不同的特征信息,则每个特征信息可以表示为如表2所示:
表2
k<sub>1</sub> | k<sub>2</sub> | ... | k<sub>m</sub> | |
Y<sub>1</sub> | Y<sub>11</sub> | Y<sub>12</sub> | ... | Y<sub>1m</sub> |
... | ... | ... | ||
Y<sub>n</sub> | Y<sub>n1</sub> | Y<sub>n2</sub> | ... | Y<sub>nm</sub> |
其中,Yij表示特征信息的权重,1≤i≤n,1≤j≤m,特征信息的权重可以通过有序二元比较量化法进行确定,k1...km表示m个特征向量。
需要说明的是,所述有序二元比较量化法将x个目标特征信息进行二元比较重要性定性排序,经过一致性检验判断与调整得到排序一致性二元对比标度矩阵E,根据标度矩阵E各行元素值之和,从大到小排列,得到关于优的排序次数,再以排序第1位的目标作为标准,与其他目标进行重要性程度的比较,可得非归一化目标权向量w'=w'1,w'2,…,w'p,然后进行归一化计算,即可得目标权向量式w=w1,w2,…,wp,以满足
上述产品分析装置与上述产品分析方法一一对应,其具体的原理和过程与上述实施例所述方法相同,不再赘述。
上述产品分析装置可以实现为一种计算机程序的形式,计算机程序可以在如图7所示的计算机设备上运行。
图7为本发明一种计算机设备的结构组成示意图。该设备可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式装置等具有通信功能的电子装置。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。参照图7,该计算机设备500包括通过***总线501连接的处理器502、非易失性存储介质503、内存储器504和网络接口505。其中,该计算机设备500的非易失性存储介质503可存储操作***5031和计算机程序5032,该计算机程序5032被执行时,可使得处理器502执行一种产品分析方法。该计算机设备500的处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序被处理器执行时,可使得处理器502执行一种产品分析方法。计算机设备500的网络接口505用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502执行所述计算机程序时实现如下操作:
获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;
提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;
对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;
将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;
获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。
在一个实施例中,所述提取所述预设数据库中的用户数据并确定所述用户数据的特征信息,包括:
获取所述用户数据中的用户属性关键词;
确定所述用户属性关键词所指示的特征信息,并提取所确定的特征信息。
在一个实施例中,所述对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量,包括:
根据预先存储的各类别的类别特征信息,确定所述待分类的特征信息所对应的类别;
根据所对应的类别对所述待分类的特征信息进行分类;
根据预设向量空间模型将已分类的特征信息进行转换得到已分类的特征向量。
在一个实施例中,所述预设朴素贝叶斯分类算法模型为:其中,设A={a1,a2,...,am}为待分析的特征向量集合,每个a为特征向量集合X的特征向量,C={C1,C2,....,Cn}为待分析的特征向量的分类集合。
在一个实施例中,计算p(C|A)的具体步骤包括:
统计待分析的特征向量分类集合中各特征向量的条件概率:p(a1|C1),p(a2|C2),…,p(am|Cn);
根据朴素贝叶斯定理将所统计的各特征向量的条件概率作为朴素贝叶斯定理的训练数据进行输入,并得到各特征向量的模型库。
本领域技术人员可以理解,图7中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图7所示实施例一致,在此不再赘述。
本发明提供了一种计算机可读存储介质,计算机可读存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现以下步骤:
获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;
提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;
对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;
将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;
获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。
在一个实施例中,所述提取所述预设数据库中的用户数据并确定所述用户数据的特征信息,包括:
获取所述用户数据中的用户属性关键词;
确定所述用户属性关键词所指示的特征信息,并提取所确定的特征信息。
在一个实施例中,所述对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量,包括:
根据预先存储的各类别的类别特征信息,确定所述待分类的特征信息所对应的类别;
根据所对应的类别对所述待分类的特征信息进行分类;
根据预设向量空间模型将已分类的特征信息进行转换得到已分类的特征向量。
在一个实施例中,所述预设朴素贝叶斯分类算法模型为:其中,设A={a1,a2,...,am}为待分析的特征向量集合,每个a为特征向量集合X的特征向量,C={C1,C2,....,Cn}为待分析的特征向量的分类集合。
在一个实施例中,计算p(C|A)的具体步骤包括:
统计待分析的特征向量分类集合中各特征向量的条件概率:p(a1|C1),p(a2|C2),…,p(am|Cn);
根据朴素贝叶斯定理将所统计的各特征向量的条件概率作为朴素贝叶斯定理的训练数据进行输入,并得到各特征向量的模型库。
本发明前述的存储介质包括:磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等各种可以存储程序代码的介质。
本发明所有实施例中的单元可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
本发明实施例产品分析方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例产品分析装置中的单元可以根据实际需要进行合并、划分和删减。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种产品分析方法,其特征在于,所述方法包括:
获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;
提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;
对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;
将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;
获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。
2.如权利要求1所述的方法,其特征在于,所述提取所述预设数据库中的用户数据并确定所述用户数据的特征信息,包括:
获取所述用户数据中的用户属性关键词;
确定所述用户属性关键词所指示的特征信息,并提取所确定的特征信息。
3.如权利要求1所述的方法,其特征在于,所述对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量,包括:
根据预先存储的各类别的类别特征信息,确定所述待分类的特征信息所对应的类别;
根据所对应的类别对所述待分类的特征信息进行分类;
根据预设向量空间模型将已分类的特征信息进行转换得到已分类的特征向量。
4.如权利要求1所述的方法,其特征在于,所述预设朴素贝叶斯分类算法模型为:其中,设A={a1,a2,...,am}为待分析的特征向量集合,每个a为特征向量集合X的特征向量,C={C1,C2,....,Cn}为待分析的特征向量的分类集合。
5.如权利要求4所述的方法,其特征在于,计算p(C|A)的具体步骤包括:
统计待分析的特征向量分类集合中各特征向量的条件概率:p(a1|C1),p(a2|C2),…,p(am|Cn);
根据朴素贝叶斯定理将所统计的各特征向量的条件概率作为朴素贝叶斯定理的训练数据进行输入,并得到各特征向量的模型库。
6.一种产品分析装置,其特征在于,所述装置包括:
第一获取单元,用于获取针对产品的用户数据,并将所获取的用户数据存储至预设数据库中;
提取单元,用于提取所述预设数据库中的用户数据并确定所述用户数据的特征信息;
转换单元,用于对所确定的特征信息进行分类,并将已分类的特征信息转换为特征向量;
训练单元,用于将已分类的特征向量作为训练数据,并利用预设朴素贝叶斯分类算法模型进行训练以得到模型库;
执行单元,用于获取指定用户输入的指定用户数据,并将所述指定用户数据输入至所述朴素贝叶斯分类算法模型库中,得到指定产品的匹配结果。
7.如权利要求6所述的装置,其特征在于,所述提取单元,包括:
第二获取单元,用于获取所述用户数据中的用户属性关键词;
提取子单元,用于确定所述用户属性关键词所指示的特征信息,并提取所确定的特征信息。
8.如权利要求6所述的装置,其特征在于,所述转换单元,包括:
确定单元,用于根据预先存储的各类别的类别特征信息,确定所述待分类的特征信息所对应的类别;
分类单元,用于根据所对应的类别对所述待分类的特征信息进行分类;
转换子单元,用于根据预设向量空间模型将已分类的特征信息进行转换得到已分类的特征向量。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5任一项所述的产品分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现如权利要求1-5任一项所述的产品分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811213732.3A CN109614982A (zh) | 2018-10-18 | 2018-10-18 | 产品分析方法、装置、计算机设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811213732.3A CN109614982A (zh) | 2018-10-18 | 2018-10-18 | 产品分析方法、装置、计算机设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109614982A true CN109614982A (zh) | 2019-04-12 |
Family
ID=66002903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811213732.3A Pending CN109614982A (zh) | 2018-10-18 | 2018-10-18 | 产品分析方法、装置、计算机设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109614982A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110837843A (zh) * | 2019-09-26 | 2020-02-25 | 平安银行股份有限公司 | 信息分类方法、装置、计算机设备及存储介质 |
CN112036648A (zh) * | 2020-09-02 | 2020-12-04 | 中国平安财产保险股份有限公司 | 基于模型的任务分配方法、装置、计算机设备和存储介质 |
WO2020253381A1 (zh) * | 2019-06-17 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 数据监控方法、装置、计算机设备和存储介质 |
CN112988982A (zh) * | 2021-05-17 | 2021-06-18 | 江苏联著实业股份有限公司 | 一种计算机比较空间的自主学习方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600369A (zh) * | 2016-12-09 | 2017-04-26 | 广东奡风科技股份有限公司 | 基于朴素贝叶斯分类的银行金融产品实时推荐***和方法 |
CN106651424A (zh) * | 2016-09-28 | 2017-05-10 | 国网山东省电力公司电力科学研究院 | 基于大数据技术的电力用户画像建立与分析方法 |
CN107562818A (zh) * | 2017-08-16 | 2018-01-09 | 中国工商银行股份有限公司 | 信息推荐***及方法 |
CN107977864A (zh) * | 2017-12-07 | 2018-05-01 | 北京贝塔智投科技有限公司 | 一种适用于金融场景的客户洞察方法和*** |
-
2018
- 2018-10-18 CN CN201811213732.3A patent/CN109614982A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106651424A (zh) * | 2016-09-28 | 2017-05-10 | 国网山东省电力公司电力科学研究院 | 基于大数据技术的电力用户画像建立与分析方法 |
CN106600369A (zh) * | 2016-12-09 | 2017-04-26 | 广东奡风科技股份有限公司 | 基于朴素贝叶斯分类的银行金融产品实时推荐***和方法 |
CN107562818A (zh) * | 2017-08-16 | 2018-01-09 | 中国工商银行股份有限公司 | 信息推荐***及方法 |
CN107977864A (zh) * | 2017-12-07 | 2018-05-01 | 北京贝塔智投科技有限公司 | 一种适用于金融场景的客户洞察方法和*** |
Non-Patent Citations (2)
Title |
---|
杨明迪: "我国网络借贷平台评级体系研究", 中国优秀硕士学位论文全文数据库 经济与管理科学辑, no. 01, 15 January 2018 (2018-01-15), pages 162 - 105 * |
温季等: "《中原现代农业科技示范区水资源承载力及高效利用关键技术》", 31 August 2018, 郑州:黄河水利出版社, pages: 45 - 52 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020253381A1 (zh) * | 2019-06-17 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 数据监控方法、装置、计算机设备和存储介质 |
CN110837843A (zh) * | 2019-09-26 | 2020-02-25 | 平安银行股份有限公司 | 信息分类方法、装置、计算机设备及存储介质 |
CN110837843B (zh) * | 2019-09-26 | 2024-05-14 | 平安银行股份有限公司 | 信息分类方法、装置、计算机设备及存储介质 |
CN112036648A (zh) * | 2020-09-02 | 2020-12-04 | 中国平安财产保险股份有限公司 | 基于模型的任务分配方法、装置、计算机设备和存储介质 |
CN112988982A (zh) * | 2021-05-17 | 2021-06-18 | 江苏联著实业股份有限公司 | 一种计算机比较空间的自主学习方法及*** |
CN112988982B (zh) * | 2021-05-17 | 2021-08-24 | 江苏联著实业股份有限公司 | 一种计算机比较空间的自主学习方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614982A (zh) | 产品分析方法、装置、计算机设备以及存储介质 | |
TW201946013A (zh) | 基於lstm模型的信用風險預測方法及裝置 | |
CN108681970A (zh) | 基于大数据的理财产品推送方法、***及计算机存储介质 | |
Malik et al. | Applied unsupervised learning with R: Uncover hidden relationships and patterns with k-means clustering, hierarchical clustering, and PCA | |
EP3074863B1 (en) | System and method for testing data representation for different mobile devices | |
CN113508378A (zh) | 推荐模型的训练方法、推荐方法、装置及计算机可读介质 | |
CN103927615B (zh) | 将实体与类别相关联 | |
Li et al. | A solanaceae disease recognition model based on SE-Inception | |
CN109241857A (zh) | 一种单据信息的识别方法及*** | |
CN108491511A (zh) | 基于图数据的数据挖掘方法和装置、模型训练方法和装置 | |
CN107423613A (zh) | 依据相似度确定设备指纹的方法、装置及服务器 | |
CN108280104A (zh) | 目标对象的特征信息提取方法及装置 | |
CN104423945B (zh) | 一种信息处理方法及电子设备 | |
CN113326900A (zh) | 联邦学习模型的数据处理方法、装置及存储介质 | |
CN112116245A (zh) | 信贷风险评估方法、装置、计算机设备及存储介质 | |
CN110033120A (zh) | 用于为商户提供风险预测赋能服务的方法及装置 | |
CN112070310A (zh) | 基于人工智能的流失用户预测方法、装置及电子设备 | |
CN113095408A (zh) | 风险的确定方法、装置和服务器 | |
CN108228684A (zh) | 聚类模型的训练方法、装置、电子设备和计算机存储介质 | |
CN109272402A (zh) | 评分卡的建模方法、装置、计算机设备及存储介质 | |
CN113742492A (zh) | 保险方案生成方法、装置、电子设备及存储介质 | |
CN109635260A (zh) | 用于生成文章模板的方法、装置、设备和存储介质 | |
CN110276382A (zh) | 基于谱聚类的人群分类方法、装置及介质 | |
CN109740129A (zh) | 基于区块链的报表生成方法、装置、设备及可读存储介质 | |
CN110349013A (zh) | 风险控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |