CN109583777A - 一种金融产品推荐***、方法、设备及介质 - Google Patents
一种金融产品推荐***、方法、设备及介质 Download PDFInfo
- Publication number
- CN109583777A CN109583777A CN201811481623.XA CN201811481623A CN109583777A CN 109583777 A CN109583777 A CN 109583777A CN 201811481623 A CN201811481623 A CN 201811481623A CN 109583777 A CN109583777 A CN 109583777A
- Authority
- CN
- China
- Prior art keywords
- financial product
- cluster
- sample
- earning rate
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 238000004891 communication Methods 0.000 claims abstract description 15
- 238000012384 transportation and delivery Methods 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 10
- 230000009193 crawling Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23211—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种金融产品推荐***、方法、设备及介质,包括:数量值确定模块,用于确定预设数量值N;聚类中心确定模块,用于根据所述预设数量值N,从预设金融产品样本池中选取出N个金融产品样本作为N个初始聚类中心;样本聚类模块,用于基于所述N个初始聚类中心,并利用ISODATA算法,对所述预设金融产品样本池中的所有金融产品样本进行聚类操作,得到相应的聚类结果;待推荐样本确定模块,用于根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个金融产品样本;通讯模块,用于通过预设的通讯接口将所述待推荐的多个金融产品样本传输至相应的用户终端设备。本申请能够为用户提供投资风险较低的投资组合。
Description
技术领域
本申请涉及信息推荐技术领域,特别涉及一种金融产品推荐***、方法、设备及介质。
背景技术
目前,个人投资者或金融机构为了降低投资风险,习惯于将自身所持有的资产投资于多个不同的金融产品,如多只股票、多个基金、多只债券,或同时投资股市、基金和债券等多种金融产品。这些投资组合在一定程度上能够降低投资风险,其主要思想是通过使选择的金融产品尽可能的分散化、多样化以达到分散投资者投资风险,减少不必要投资损失。
然而,现在人们很难做出较优的投资组合。以主流的金融产品股票为例,在实际的股票投资组合选取过程中,由于个股的数量大,种类庞多,且极易受股市的影响,因此往往不容易获取到较为分散的投资组合选股,致使人们需要承受较大的投资风险。如何为用户提供投资风险较低的投资组合是目前有待进一步解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种金融产品推荐***、方法、设备及介质,能够为用户提供投资风险较低的投资组合。其具体方案如下:
第一方面,本申请公开了一种金融产品推荐***,包括:
数量值确定模块,用于确定预设数量值N;
聚类中心确定模块,用于根据所述预设数量值N,从预设金融产品样本池中选取出N个金融产品样本作为N个初始聚类中心;
样本聚类模块,用于基于所述N个初始聚类中心,并利用ISODATA算法,对所述预设金融产品样本池中的所有金融产品样本进行聚类操作,得到相应的聚类结果;
待推荐样本确定模块,用于根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个金融产品样本;
通讯模块,用于通过预设的通讯接口将所述待推荐的多个金融产品样本传输至相应的用户终端设备。
可选的,所述金融产品推荐***,还包括:
样本池构建模块,用于从预设的金融产品数据库中爬取预设天数内的金融产品,得到所述预设金融产品样本池。
可选的,金融产品推荐***,还包括:
归一化处理模块,用于利用预设公式,对所述金融产品样本的原始日收益率进行归一化处理,得到相应的归一化日收益率;
样本值确定模块,用于将所述归一化日收益率作为所述金融产品样本的样本值;
其中,所述预设公式为:
P_value*=(P_value-min)/max-min;
其中,P_value*表示所述归一化日收益率,P_value表示所述原始日收益率,min表示所述预设天数内的最小原始日收益率,max表示所述预设天数内的最大原始日收益率。
可选的,所述数量值确定模块,具体用于利用手肘法确定预设数量值N。
第二方面,本申请公开了一种金融产品推荐方法,包括:
确定预设数量值N;
根据所述预设数量值N,从预设金融产品样本池中选取出N个金融产品样本作为N个初始聚类中心;
基于所述N个初始聚类中心,并利用ISODATA算法,对所述预设金融产品样本池中的所有金融产品样本进行聚类操作,得到相应的聚类结果;
根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个金融产品样本;
通过预设的通讯接口将所述待推荐的多个金融产品样本传输至相应的用户终端设备。
可选的,所述确定预设数量值N之前,还包括:
从预设的金融产品数据库中爬取预设天数内的金融产品,得到所述预设金融产品样本池。
可选的,所述确定预设数量值N之前,还包括:
利用预设公式,对所述金融产品样本的原始日收益率进行归一化处理,得到相应的归一化日收益率;
将所述归一化日收益率作为所述金融产品样本的样本值;
其中,所述预设公式为:
P_value*=(P_value-min)/max-min;
其中,P_value*表示所述归一化日收益率,P_value表示所述原始日收益率,min表示所述预设天数内的最小原始日收益率,max表示所述预设天数内的最大原始日收益率。
可选的,所述确定预设数量值N,包括:
利用手肘法确定预设数量值N。
第三方面,本申请公开了一种金融产品推荐设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的金融产品推荐方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的金融产品推荐方法。
可见,本申请在确定出预设数量值之后,从预设金融产品样本池中选取出相应数量的金融产品样本作为初始聚类中心,然后利用ISODATA算法对所有金融产品样本进行聚类操作,接着根据聚类结果中的各个最终的聚类中心,确定出待推荐的金融产品样本,并通过预设通讯接口推荐到相应的用户终端设备。由此可见,本申请是基于ISODATA算法对预设金融产品样本池中的所有金融产品样本进行聚类操作,这样可以得到多个最终的聚类中心,并且这些聚类中心之间的相似性非常低,以这些相似性较低的多个聚类中心为依据所确定出的多个待推荐的金融产品样本具有更大的分散性,这样有利于降低用户的投资风险。综上,本申请能够为用户提供投资风险较低的投资组合。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种金融产品推荐***结构示意图;
图2为手肘法应用示意图;
图3为本申请公开的一种金融产品推荐方法流程图;
图4为本申请公开的一种具体的金融产品推荐方法流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例公开了一种金融产品推荐***,参见图1所示,该***包括:
数量值确定模块11,用于确定预设数量值N;
聚类中心确定模块12,用于根据所述预设数量值N,从预设金融产品样本池中选取出N个金融产品样本作为N个初始聚类中心;
样本聚类模块13,用于基于所述N个初始聚类中心,并利用ISODATA算法(即Iterative Selforganizing Data Analysis Techniques Algorithm,迭代自组织数据分析算法),对所述预设金融产品样本池中的所有金融产品样本进行聚类操作,得到相应的聚类结果;
待推荐样本确定模块14,用于根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个金融产品样本;
通讯模块15,用于通过预设的通讯接口将所述待推荐的多个金融产品样本传输至相应的用户终端设备。
可以理解的是,在利用ISODATA算法进行上述聚类操作的过程中,具体可以通过欧式距离来计算各个金融产品与各聚类中心之间的相似度,另外,在上述聚类操作过程中,还会修正聚类中心并计算各类中的各金融产品样本的距离指标函数,并按照给定的要求,将前一次获得的聚类集进行合并和***处理,从而获得新的聚类中心,特别地,若聚类中心的数目小于或等于预期值的一半,或者说迭代运算的次数是奇数次迭代且聚类中心的数目小于预期值的两倍,则对已有的聚类进行***处理;相反,若迭代运算的次数是偶数次或者聚类中心的数目大于预期值的两倍,则进行相应的合并处理。另外,还需在每次迭代过程中计算各项参数指标,并根据得到的参数指标来判断聚类结果是否符合要求。经过多次迭代后,若结果收敛,则聚类运算结束,从而得到相应的聚类结果。
进一步的,所述待推荐样本确定模块14在确定待推荐的金融产品样本时,若聚类结果中聚类簇的聚类中心是某个金融产品样本,则直接选取该聚类中心作为投资组合的待推荐的金融产品样本;若聚类簇的聚类中心不是金融产品样本数据,则用欧氏距离方法计算该簇中所有金融产品样本数据到聚类中心的距离,并选取距离最小的金融产品样本作为待推荐的金融产品样本。
可以理解的是,本实施例中的金融产品包括但不限于股票、基金、债券、期货、保单等。
可见,本申请实施例在确定出预设数量值之后,从预设金融产品样本池中选取出相应数量的金融产品样本作为初始聚类中心,然后利用ISODATA算法对所有金融产品样本进行聚类操作,接着根据聚类结果中的各个最终的聚类中心,确定出待推荐的金融产品样本,并通过预设通讯接口推荐到相应的用户终端设备。由此可见,本申请实施例是基于ISODATA算法对预设金融产品样本池中的所有金融产品样本进行聚类操作,这样可以得到多个最终的聚类中心,并且这些聚类中心之间的相似性非常低,以这些相似性较低的多个聚类中心为依据所确定出的多个待推荐的金融产品样本具有更大的分散性,这样有利于降低用户的投资风险。综上,本申请实施例能够为用户提供投资风险较低的投资组合。
在前述实施例的基础上,本申请实施例对技术方案作了进一步的优化和说明。具体的:
本实施例中,所述金融产品推荐***,还可以进一步包括:
样本池构建模块,用于从预设的金融产品数据库中爬取预设天数内的金融产品,得到所述预设金融产品样本池。
例如,可以从沪深300成份股、上证指数、深圳指数等常用的股票池中爬取预设天数内的股票交易数据,然后将爬取到的数据加入到预设金融产品样本池中。本实施例中,上述爬取过程的时间以天数为单位,其中,天数的选取对聚类的效果有着极大的影响,天数过长会增加聚类过程的计算复杂度,天数太短会降低聚类的准确度和可信度,经过反复的论证,本实施例可以将上述预设天数所处的范围可以是30至60天。
进一步的,由于考虑到不同股票等金融产品具有不同的量纲,这会对数据相似度的结果产生影响,为了消除日收益率之间的量纲影响,在计算各金融产品之间的相似度之前,需要先对股票、基金等金融产品进行标准化处理,以解决各金融产品日收益率之间的可比性问题。具体的,所述金融产品推荐***,还可以包括:
归一化处理模块,用于利用预设公式,对所述金融产品样本的原始日收益率进行归一化处理,得到相应的归一化日收益率;
样本值确定模块,用于将所述归一化日收益率作为所述金融产品样本的样本值;
其中,所述预设公式为:
P_value*=(P_value-min)/max-min;
其中,P_value*表示所述归一化日收益率,P_value表示所述原始日收益率,min表示所述预设天数内的最小原始日收益率,max表示所述预设天数内的最大原始日收益率。
其中,原始日收益率P_value的计算公式具体为:
P_value=(incomei-incomei-1)/incomei-1;
其中,incomei是指金融产品第i天的收益。则原始日收益率P_value表示当天收益相比于昨天收益的增长率。因此各金融产品可以看作是在固定时间内以收益率为基准的金融时间序列。这里选取收益率作为度量进行分析是源于收益率更能够反映股票等金融产品的变化趋势,可信度高,而且计算简单,易于获取。
可以理解的是,原始金融产品数据经过上述归一化处理之后,各金融产品的日收益率处于同一数量级,这样方便于进行不同金融产品之间的日收益率之差的计算。本实施例中,特定时间内两个金融产品的日收益率偏差是判断这两个金融产品的相关性的重要指标。
另外,本实施例中,所述数量值确定模块,具体可以用于利用手肘法确定预设数量值N。
其中,手肘法用于确定初始聚类中心的数目的的核心思想是:随着聚类数k的增大,金融产品样本会被划分的更为精细,每个簇的聚类程度会逐渐提高,这样误差平方和SSE自然就会逐渐变小。并且,当聚类数k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,所以的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,也就是说SSE和k的关系图是一个手肘的形状,参见图2所示,而这个肘部对应的k值就是数据的真实聚类数。以图2中示出的例子为例,肘部对于的k值为4,故对于图2所对应的数据集聚类而言,最佳的初始聚类数应该是4。
需要指出的是,为了计算上述误差平方和SSE,可以从预设金融产品样本池中随机选取出k个聚类中心,通过枚举令k从2到一个固定值如10,然后在每个k值上重复运行数次k-means算法,并计算当前k对应的SSE,具体的计算公式如下:
其中,Ci表示第i个簇,p是簇Ci的样本点,mi是簇Ci中所有样本的均值,SSE是所有样本的聚类误差,也是手肘法的核心指标,代表了聚类效果的好坏。
可见,本实施例中ISODATA聚类过程中的初始聚类中心的数量是通过多次k-means并结合手肘法来确定的,这样有利于减少聚类算法的迭代次数,降低计算过程所需时间。另外,本实施例通过数据的归一化处理有效的避免了因资本不同而导致数据量纲有差异进而影响聚类结果的情况出现。
参见图3所示,本申请实施例进一步公开了一种金融产品推荐方法,包括:
步骤S11:确定预设数量值N;
步骤S12:根据所述预设数量值N,从预设金融产品样本池中选取出N个金融产品样本作为N个初始聚类中心;
步骤S13:基于所述N个初始聚类中心,并利用ISODATA算法,对所述预设金融产品样本池中的所有金融产品样本进行聚类操作,得到相应的聚类结果;
步骤S14:根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个金融产品样本;
步骤S15:通过预设的通讯接口将所述待推荐的多个金融产品样本传输至相应的用户终端设备。
可以理解的是,在利用ISODATA算法进行上述聚类操作的过程中,具体可以通过欧式距离来计算各个金融产品与各聚类中心之间的相似度,另外,在上述聚类操作过程中,还会修正聚类中心并计算各类中的各金融产品样本的距离指标函数,并按照给定的要求,将前一次获得的聚类集进行合并和***处理,从而获得新的聚类中心,特别地,若聚类中心的数目小于或等于预期值的一半,或者说迭代运算的次数是偶数次迭代且聚类中心的数目小于预期值的两倍,则对已有的聚类进行***处理;相反,若迭代运算的次数是奇数次或者聚类中心的数目大于预期值的两倍,则进行相应的合并处理。另外,还需在每次迭代过程中计算各项参数指标,并根据得到的参数指标来判断聚类结果是否符合要求。经过多次迭代后,若结果收敛,则聚类运算结束,从而得到相应的聚类结果。
进一步的,在确定待推荐的金融产品样本时,若聚类结果中聚类簇的聚类中心是某个金融产品样本,则直接选取该聚类中心作为投资组合的待推荐的金融产品样本;若聚类簇的聚类中心不是金融产品样本数据,则用欧氏距离方法计算该簇中所有金融产品样本数据到聚类中心的距离,并选取距离最小的金融产品样本作为待推荐的金融产品样本。
可以理解的是,本实施例中的金融产品包括但不限于股票、基金、债券、期货、保单等。
可见,本申请实施例在确定出预设数量值之后,从预设金融产品样本池中选取出相应数量的金融产品样本作为初始聚类中心,然后利用ISODATA算法对所有金融产品样本进行聚类操作,接着根据聚类结果中的各个最终的聚类中心,确定出待推荐的金融产品样本,并通过预设通讯接口推荐到相应的用户终端设备。由此可见,本申请实施例是基于ISODATA算法对预设金融产品样本池中的所有金融产品样本进行聚类操作,这样可以得到多个最终的聚类中心,并且这些聚类中心之间的相似性非常低,以这些相似性较低的多个聚类中心为依据所确定出的多个待推荐的金融产品样本具有更大的分散性,这样有利于降低用户的投资风险。综上,本申请实施例能够为用户提供投资风险较低的投资组合。
进一步的,所述确定预设数量值N之前,还可以包括:
从预设的金融产品数据库中爬取预设天数内的金融产品,得到所述预设金融产品样本池。
例如,可以从沪深300成份股、上证指数、深圳指数等常用的股票池中爬取预设天数内的股票交易数据,然后将爬取到的数据加入到预设金融产品样本池中。本实施例中,上述爬取过程的时间以天数为单位,其中,天数的选取对聚类的效果有着极大的影响,天数过长会增加聚类过程的计算复杂度,天数太短会降低聚类的准确度和可信度,经过反复的论证,本实施例可以将上述预设天数所处的范围可以是30至60天。
进一步的,由于考虑到不同股票等金融产品具有不同的量纲,这会对数据相似度的结果产生影响,为了消除日收益率之间的量纲影响,在计算各金融产品之间的相似度之前,需要先对股票、基金等金融产品进行标准化处理,以解决各金融产品日收益率之间的可比性问题。具体的,所述确定预设数量值N之前,还可以包括:
利用预设公式,对所述金融产品样本的原始日收益率进行归一化处理,得到相应的归一化日收益率;
将所述归一化日收益率作为所述金融产品样本的样本值;
其中,所述预设公式为:
P_value*=(P_value-min)/max-min;
其中,P_value*表示所述归一化日收益率,P_value表示所述原始日收益率,min表示所述预设天数内的最小原始日收益率,max表示所述预设天数内的最大原始日收益率。
其中,原始日收益率P_value的计算公式具体为:
P_value=(incomei-incomei-1)/incomei-1;
其中,incomei是指金融产品第i天的收益。则原始日收益率P_value表示当天收益相比于昨天收益的增长率。因此各金融产品可以看作是在固定时间内以收益率为基准的金融时间序列。这里选取收益率作为度量进行分析是源于收益率更能够反映股票等金融产品的变化趋势,可信度高,而且计算简单,易于获取。
可以理解的是,原始金融产品数据经过上述归一化处理之后,各金融产品的日收益率处于同一数量级,这样方便于进行不同金融产品之间的日收益率之差的计算。本实施例中,特定时间内两个金融产品的日收益率偏差是判断这两个金融产品的相关性的重要指标。
进一步的,所述确定预设数量值N,具体可以包括:利用手肘法确定预设数量值N。
其中,手肘法用于确定初始聚类中心的数目的的核心思想是:随着聚类数k的增大,金融产品样本会被划分的更为精细,每个簇的聚类程度会逐渐提高,这样误差平方和SSE自然就会逐渐变小。并且,当聚类数k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,所以的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,也就是说SSE和k的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数。
需要指出的是,为了计算上述误差平方和SSE,可以从预设金融产品样本池中随机选取出k个聚类中心,通过枚举令k从2到一个固定值如10,然后在每个k值上重复运行数次k-means算法,并计算当前k对应的SSE,具体的计算公式如下:
其中,Ci表示第i个簇,p是簇Ci的样本点,mi是簇Ci中所有样本的均值,SSE是所有样本的聚类误差,也是手肘法的核心指标,代表了聚类效果的好坏。
可见,本实施例中ISODATA聚类过程中的初始聚类中心的数量是通过多次k-means并结合手肘法来确定的,这样有利于减少聚类算法的迭代次数,降低计算过程所需时间。另外,本实施例通过数据的归一化处理有效的避免了因资本不同而导致数据量纲有差异进而影响聚类结果的情况出现。
参见图4所示,本申请实施例公开了一种具体的股票推荐方法,包括:
步骤S21:从预设的股票数据库中爬取预设天数内的股票样本,得到预设股票样本池。
步骤S22:计算所述预设股票样本池中每个股票的归一化日收益率,并将其作为股票样本的样本值。
步骤S23:利用手肘法确定预设数量值N。
步骤S24:根据所述预设数量值N,从预设股票样本池中随机选取出N个股票样本作为N个初始聚类中心。
步骤S25:基于所述N个初始聚类中心,并利用ISODATA算法,对所述预设股票样本池中的所有股票样本进行聚类操作,得到相应的聚类结果。
步骤S26:根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个股票样本。
步骤S27:通过预设的通讯接口将所述待推荐的多个股票样本传输至相应的用户终端设备。
进一步的,本申请实施例还公开了一种金融产品推荐设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述实施例公开的金融产品推荐方法。
进一步的,本申请实施例还公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时前述实施例公开金融产品推荐方法。
其中,关于上述方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种金融产品推荐***、方法、设备及介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种金融产品推荐***,其特征在于,包括:
数量值确定模块,用于确定预设数量值N;
聚类中心确定模块,用于根据所述预设数量值N,从预设金融产品样本池中选取出N个金融产品样本作为N个初始聚类中心;
样本聚类模块,用于基于所述N个初始聚类中心,并利用ISODATA算法,对所述预设金融产品样本池中的所有金融产品样本进行聚类操作,得到相应的聚类结果;
待推荐样本确定模块,用于根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个金融产品样本;
通讯模块,用于通过预设的通讯接口将所述待推荐的多个金融产品样本传输至相应的用户终端设备。
2.根据权利要求1所述的金融产品推荐***,其特征在于,还包括:
样本池构建模块,用于从预设的金融产品数据库中爬取预设天数内的金融产品,得到所述预设金融产品样本池。
3.根据权利要求2所述的金融产品推荐***,其特征在于,还包括:
归一化处理模块,用于利用预设公式,对所述金融产品样本的原始日收益率进行归一化处理,得到相应的归一化日收益率;
样本值确定模块,用于将所述归一化日收益率作为所述金融产品样本的样本值;
其中,所述预设公式为:
P_value*=(P_value-min)/max-min;
其中,P_value*表示所述归一化日收益率,P_value表示所述原始日收益率,min表示所述预设天数内的最小原始日收益率,max表示所述预设天数内的最大原始日收益率。
4.根据权利要求3所述的金融产品推荐***,其特征在于,
所述数量值确定模块,具体用于利用手肘法确定预设数量值N。
5.一种金融产品推荐方法,其特征在于,包括:
确定预设数量值N;
根据所述预设数量值N,从预设金融产品样本池中选取出N个金融产品样本作为N个初始聚类中心;
基于所述N个初始聚类中心,并利用ISODATA算法,对所述预设金融产品样本池中的所有金融产品样本进行聚类操作,得到相应的聚类结果;
根据所述聚类结果中的各个最终聚类中心,确定出待推荐的多个金融产品样本;
通过预设的通讯接口将所述待推荐的多个金融产品样本传输至相应的用户终端设备。
6.根据权利要求5所述的金融产品推荐方法,其特征在于,所述确定预设数量值N之前,还包括:
从预设的金融产品数据库中爬取预设天数内的金融产品,得到所述预设金融产品样本池。
7.根据权利要求6所述的金融产品推荐方法,其特征在于,所述确定预设数量值N之前,还包括:
利用预设公式,对所述金融产品样本的原始日收益率进行归一化处理,得到相应的归一化日收益率;
将所述归一化日收益率作为所述金融产品样本的样本值;
其中,所述预设公式为:
P_value*=(P_value-min)/max-min;
其中,P_value*表示所述归一化日收益率,P_value表示所述原始日收益率,min表示所述预设天数内的最小原始日收益率,max表示所述预设天数内的最大原始日收益率。
8.根据权利要求7所述的金融产品推荐方法,其特征在于,所述确定预设数量值N,包括:
利用手肘法确定预设数量值N。
9.一种金融产品推荐设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求5至8任一项所述的金融产品推荐方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求5至8任一项所述的金融产品推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811481623.XA CN109583777A (zh) | 2018-12-05 | 2018-12-05 | 一种金融产品推荐***、方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811481623.XA CN109583777A (zh) | 2018-12-05 | 2018-12-05 | 一种金融产品推荐***、方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109583777A true CN109583777A (zh) | 2019-04-05 |
Family
ID=65927308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811481623.XA Pending CN109583777A (zh) | 2018-12-05 | 2018-12-05 | 一种金融产品推荐***、方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109583777A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110086874A (zh) * | 2019-04-30 | 2019-08-02 | 清华大学 | 一种高速公路服务区用户分类方法、***、设备及介质 |
CN110766208A (zh) * | 2019-10-09 | 2020-02-07 | 中电科新型智慧城市研究院有限公司 | 一种基于社会群体行为的政务服务需求预测方法 |
CN111832986A (zh) * | 2020-06-05 | 2020-10-27 | 广东工业大学 | 一种产品入库存储方法、***、存储介质及计算机设备 |
CN112287244A (zh) * | 2020-10-29 | 2021-01-29 | 平安科技(深圳)有限公司 | 基于联邦学习的产品推荐方法、装置、计算机设备及介质 |
CN117035948A (zh) * | 2023-10-10 | 2023-11-10 | 山东唐和智能科技有限公司 | 基于大数据的任务智能处理方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440398A (zh) * | 2013-07-10 | 2013-12-11 | 武汉大学 | 一种基于模式识别的电网支路重要性评估方法 |
CN106897797A (zh) * | 2017-02-23 | 2017-06-27 | 南京大学 | 一种基于社会网络聚类的股票指数跟踪预测方法及*** |
CN107909478A (zh) * | 2017-11-27 | 2018-04-13 | 苏州点对点信息科技有限公司 | 基于社会网络聚类和信息增益熵指标的fof基金投资组合***及方法 |
CN108009925A (zh) * | 2017-11-27 | 2018-05-08 | 苏州点对点信息科技有限公司 | 一种基于网络聚类的基金资产配置***及方法 |
-
2018
- 2018-12-05 CN CN201811481623.XA patent/CN109583777A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440398A (zh) * | 2013-07-10 | 2013-12-11 | 武汉大学 | 一种基于模式识别的电网支路重要性评估方法 |
CN106897797A (zh) * | 2017-02-23 | 2017-06-27 | 南京大学 | 一种基于社会网络聚类的股票指数跟踪预测方法及*** |
CN107909478A (zh) * | 2017-11-27 | 2018-04-13 | 苏州点对点信息科技有限公司 | 基于社会网络聚类和信息增益熵指标的fof基金投资组合***及方法 |
CN108009925A (zh) * | 2017-11-27 | 2018-05-08 | 苏州点对点信息科技有限公司 | 一种基于网络聚类的基金资产配置***及方法 |
Non-Patent Citations (1)
Title |
---|
谢日敏 等: "高校信息***使用率聚类分析", 高校《西安文理学院学报(自然科学版)》, vol. 19, no. 5, pages 41 - 43 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110086874A (zh) * | 2019-04-30 | 2019-08-02 | 清华大学 | 一种高速公路服务区用户分类方法、***、设备及介质 |
CN110766208A (zh) * | 2019-10-09 | 2020-02-07 | 中电科新型智慧城市研究院有限公司 | 一种基于社会群体行为的政务服务需求预测方法 |
CN111832986A (zh) * | 2020-06-05 | 2020-10-27 | 广东工业大学 | 一种产品入库存储方法、***、存储介质及计算机设备 |
CN112287244A (zh) * | 2020-10-29 | 2021-01-29 | 平安科技(深圳)有限公司 | 基于联邦学习的产品推荐方法、装置、计算机设备及介质 |
CN117035948A (zh) * | 2023-10-10 | 2023-11-10 | 山东唐和智能科技有限公司 | 基于大数据的任务智能处理方法及*** |
CN117035948B (zh) * | 2023-10-10 | 2024-01-09 | 山东唐和智能科技有限公司 | 基于大数据的任务智能处理方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109583777A (zh) | 一种金融产品推荐***、方法、设备及介质 | |
Baker et al. | Farmland: Is it currently priced as an attractive investment? | |
Hu et al. | The measurement method of investor sentiment and its relationship with stock market | |
Hindrayani et al. | Indonesian stock price prediction including covid19 era using decision tree regression | |
CN110264342A (zh) | 一种基于机器学习的业务审核方法及装置 | |
Lu et al. | A clustering-based portfolio strategy incorporating momentum effect and market trend prediction | |
Eichhorn et al. | Using constraints to improve the robustness of asset allocation | |
Cai et al. | Gaussian weighting reversion strategy for accurate online portfolio selection | |
Lu et al. | A study of applying data mining approach to the information disclosure for Taiwan’s stock market investors | |
Wu et al. | Economic growth in emerging market countries | |
CN108764291A (zh) | 电子装置、基于机器学习的股票择时方法及存储介质 | |
Kašćelan et al. | Hybrid support vector machine rule extraction method for discovering the preferences of stock market investors: Evidence from Montenegro | |
Brabazon et al. | Credit classification using grammatical evolution | |
US20140279683A1 (en) | Performance Evaluation Of Mortgage Portfolios | |
Wang et al. | The impact of RMB internationalization on the exchange rate linkages in China and ASEAN countries | |
CN112767132B (zh) | 一种数据处理方法及*** | |
Yang-Chao et al. | The impact of monetary policy on China's stock and bond markets | |
CN110033376A (zh) | 一种资产管理方法及装置、一种计算设备及存储介质 | |
CN109544346A (zh) | 一种基于ap聚类算法的可控式投资组合选股方法 | |
Chio | A comparative study of the MACD-base trading strategies: evidence from the US stock market | |
CN107092919A (zh) | 一种用户样本特征优化处理方法和装置 | |
Papaioannou et al. | S&P500 Forecasting and trading using convolution analysis of major asset classes | |
CN109447814A (zh) | 金融资产分析方法和装置 | |
Jankovic et al. | Financial sector development and economic growth | |
CN106845682A (zh) | 一种待发布信息位的竞价胜出率的预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190405 |
|
RJ01 | Rejection of invention patent application after publication |