CN112612942B - 一种基于社交大数据的基金推荐***及方法 - Google Patents

一种基于社交大数据的基金推荐***及方法 Download PDF

Info

Publication number
CN112612942B
CN112612942B CN202011596610.4A CN202011596610A CN112612942B CN 112612942 B CN112612942 B CN 112612942B CN 202011596610 A CN202011596610 A CN 202011596610A CN 112612942 B CN112612942 B CN 112612942B
Authority
CN
China
Prior art keywords
fund
user
influence
node
social
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011596610.4A
Other languages
English (en)
Other versions
CN112612942A (zh
Inventor
陶飞飞
石敏芳
谭梦婕
王雅淳
庄展鹏
刘生伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202011596610.4A priority Critical patent/CN112612942B/zh
Publication of CN112612942A publication Critical patent/CN112612942A/zh
Application granted granted Critical
Publication of CN112612942B publication Critical patent/CN112612942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于社交大数据的基金推荐***及方法,该推荐***包括金融社交大数据采集模块、基金热度分析模块、基金净值风险分析模块和基金筛选推荐模块。金融社交大数据采集模块用于爬取金融社交网站用户的行为与舆情数据,基金热度分析模块用于对金融社交网站的热门基金产品进行热度分析,基金净值风险分析模块根据当前市场平均市盈率值判断基金投资风险。本发明的推荐***能更好服务于投资理财基础与经验不够完备的投资者群体,本发明的推荐方法通过设计基于自适应的用户影响力算法,对金融社交网站上的用户行为和基金热度进行分析,结合基金估值、市场风险等相关因素,为客户及其社交圈好友推荐适合投资的基金产品。

Description

一种基于社交大数据的基金推荐***及方法
技术领域
本发明涉及基金推荐***及方法,特别是指一种基于社交大数据的基金推荐***及方法。
背景技术
随着大众互联网理财观念的逐步普及,理财规模随之扩大,智能投顾以低成本、低门槛、大众定制理财方案等特点迎合了中产阶层、大众富裕阶层的理财需要,降低了投资顾问服务的门槛,使普通理财用户也可以享受投资顾问服务。但投资者大多缺乏***、科学的投资观念,投资行为更多受产品驱动,很多人还完全没有接触过关于基金投资的推荐***。
对金融投资产品进行有效分析,向用户推荐合适的投资产品,一直以来是金融投资领域的专家及从业者所期望达到的目标。在当今互联网快速发展的时代,任何信息和公众事件都有被放大的可能,在各类金融社交网站中,关于股票、基金等投资产品的舆情信息让普通投资者眼花缭乱,难以做出理性客观的选择。目前主流的智能投顾模型及算法已出现了同质化,且对用户的风险偏好测评也非常简略,只通过较为简单的问答来推测投资者的理财需求,这导致有可能向投资者推荐的并非是真正满足用户的基金投资产品。
发明内容
发明目的:本发明的第一目的为提供一种实现对基金投资的判断指导,最大程度地规避风险,提高客户投资收益的基于社交大数据的基金推荐***,本发明的第二目的为提供一种基于社交大数据的基金推荐方法。
技术方案:本发明的基于社交大数据的基金推荐***,包括金融社交大数据采集模块、基金热度分析模块、基金净值风险分析模块和基金筛选推荐模块;
金融社交大数据采集模块用于采集、处理用户的投资偏好信息及爬取金融社交网站用户的行为与舆情数据;
基金热度分析模块用于构建动态的社交拓扑网络结构,设计自适应的用户影响力度量算法,对金融社交网站中热门的基金产品进行热度分析;
基金净值风险分析模块用于根据当前市场平均市盈率值与历史高位、低位数值的比较来判断基金投资的风险大小;
基金筛选推荐模块用于综合基金估值、市场风险分析及基金热度分析的结果,为客户及其社交圈好友筛选、推荐满足客户需求的基金产品。
综上,金融社交大数据采集模块为后面根据社交网络的用户情感倾向对推荐的基金净值分析和推荐提供数据储备;基金热度分析模块引入自适应权重因子,有效实现用户投资偏好、行为与舆情的分析,通过对金融社交网站的热门基金进行热度分析,为客户推荐适合其投资偏好的基金,实现投资者的收益最大化。
本发明的基于社交大数据的基金推荐方法,包括如下步骤:
(1)采集、处理用户的投资偏好信息及爬取金融社交网站用户的行为与舆情数据;
(2)构建动态的社交拓扑网络结构,设计自适应的用户影响力度量算法,对金融社交网站中热门的基金产品进行热度分析;
(3)根据当前市场平均市盈率值与历史高位、低位数值的比较来判断基金投资的风险大小;
(4)综合基金估值、市场风险分析及基金热度分析的结果,为客户及其社交圈好友筛选、推荐满足客户需求的基金产品。
进一步地,步骤(1)中,搭建基于Hadoop的大数据平台存储用户投资偏好信息及用户的行为与舆情数据,采用MapReduce框架对金融社交大数据进行清洗和预处理。
步骤(2)中,构建动态的社交拓扑网络结构,引入自适应权重因子,设计自适应用户影响力度量算法,自动分配社交网站用户节点到其邻居节点的转移概率,使得节点间转移具有一定的自适应特征,从而对社交网站上热门的基金产品进行热度分析。
优选的,自适应权重因子包括节点间影响力、用户行为影响力以及基金热度话题影响力。
步骤(2)中,热度分析结合金融社交网站网民的情感指数;自适应的用户影响力度量算法,选取转发数、评论数、点赞数、粉丝数以及是否为意见领袖参数,实现社交用户节点到其邻居节点转移概率的更优化分配,最终有效提升节点传播能力与用户影响力度量的准确度,能够更准确地分析基金的热度。
步骤(3)中,采集基金产品的实时净值估算、单位净值以及累计净值,并每日进行增量式爬取操作,根据当前市场平均市盈率值与历史高位、低位数值的比较来判断基金投资的风险大小。
步骤(3)中,基于python的scrapy框架采集基金的实时净值估算、单位净值以及累计净值。
步骤(3)中,基金投资的风险大小判断标准为:当市场平均市盈率值在10倍以下时,则市场估值属于低估范畴;市场平均市盈率值在10倍-15倍区间则属于估值合理范畴;市场平均市盈率值在15倍以上时,当前市场的长期投资价值将会降低;市场平均市盈率值达到20倍以上时,则属于高估范畴,根据上述市盈率值所处区间判断相对风险大小。
步骤(4)中,将满足客户需求的投资方案推荐给客户,若推荐不满足则重复(2)(3)步骤调整组合;为客户推荐的基金产品同时还支持通过链接分享的形式让其社交圈好友进入平台后直接在现有方案上进行基金的购买。
步骤(4)中,既可以直接提供根据调查问卷进行用户投资偏好分析后的推荐方案,同时还提供通过社交圈好友分享的链接进入平台,直接参照好友的方案进行基金投资。由于处于同一社交圈的用户大多经济能力相仿,因此好友的基金投资方案具有较高的推荐参考价值,这项功能可以方便没有理财基础或理财基础较弱的用户能够更加便捷地进行基金投资选择。
有益效果:与现有技术相比,本发明具有如下显著优点:通过对社交大数据的分析,优化用户影响力度量算法,构建动态的社交拓扑网络结构,得出金融社交圈的热门基金产品,并根据当前市场平均市盈率值与历史高位、低位数值的比较综合判断基金投资的风险大小,最终形成有效地基金推荐方案,本基金推荐***和方法可以更好地服务于投资理财基础与经验不够完备的投资者群体。
附图说明
图1是基于社交大数据的基金推荐***的***结构图;
图2是基于社交大数据的基金推荐***的操作流程图;
图3是引入背景节点的社交网络拓扑结构图;
图4是基于自适应因子的用户影响力度量算法示意图。
具体实施方式
下面结合实施例对本发明的技术方案作进一步说明。
本发明的核心是一个基于社交大数据的基金推荐***,以方便服务于投资理财基础弱的投资者,为其在基金投资选择方面给出较优的方案。如图1所示,本发明的基于社交大数据的基金推荐***,包括金融社交大数据采集模块、基金热度分析模块、基金净值风险分析模块和基金筛选推荐模块。
金融社交大数据采集模块用于采集用户的投资偏好信息及爬取金融社交网站用户的行为与舆情数据,搭建基于Hadoop的大数据平台存储数据,采用MapReduce框架对数据进行清洗和预处理;
基金热度分析模块构建了动态的社交网络拓扑结构,引入自适应权重因子(节点间影响力、用户行为影响力以及基金热度话题影响力),设计基于自适应的用户影响力度量算法,对金融社交网站上的热门基金进行热度分析;
基金净值风险分析模块用于采集基金的实时净值估算、单位净值以及累计净值,并每日进行增量式爬取操作,根据当前市场平均市盈率值与历史高位、低位数值的比较来判断基金投资的风险大小;
基金筛选推荐模块用于根据基金净值风险分析和基金热度分析的综合筛选结果,为客户推荐合适的基金投资产品,并可以将自己的基金购买方案进一步推荐分享给社交圈好友。
图2是本发明的具体实施流程图,包括有如下步骤:
步骤1:采集基金的相关信息、客户A调查问卷中的基本信息(含用户投资偏好信息)和金融社交网站上的用户行为数据。
基金的相关信息不仅包含基金实时净值估算、单位净值以及累计净值,还有基金的风险程度、基金规模等对用户有利的信息。将这些数据添加到大数据存储***后,可根据实际行情以及金融社交网站的变化进行更新。用户的行为数据来源于雪球网、东方财富网等,包括用户发帖,点赞、转发等一系列行为消息。提取其中有用的情感评价信息,存储于Hadoop底层的HDFS文件***中。
大数据***可以采用Hadoop,Hadoop由HDFS、MapReduce、HBase、Hive和ZooKeeper等组件构成。数据采集以基于python的scrapy框架爬取为主,并每日进行数据更新爬取操作,以保证能够基于当前变化的基金市场和金融社交网络的舆情数据。
步骤2:利用节点间影响力、用户行为影响力以及基金热度话题影响力等因子,设计基于自适应的影响力度量算法,分析社交网站的用户行为与舆情数据,获取基金产品的热度,给出当前社交网站热门的基金投资产品。
在具体实现的时候,本步骤可以利用MapReduce分布式计算框架。作为一种并行处理模型,具备可扩展性高、应用方便等特点,在MapReduce基础上,对传统的MR_LSH算法的并行化进行改造,使其可以在分布式的集群环境中实现对大规模图数据的高效聚类。
步骤3:根据基金估值、市场市盈率值等风险因素综合判断当前是否适合进行基金投资,根据判断结果调整推荐方案。其中,基金投资的市场风险判断标准为:当市场平均市盈率值在10倍以下时,则市场估值属于低估范畴;市场平均市盈率值在10倍-15倍区间则属于估值合理范畴;市场平均市盈率值在15倍以上时,当前市场的长期投资价值将会降低;市场平均市盈率值达到20倍以上时,则属于高估范畴,根据上述市盈率值所处区间判断相对风险大小。
具体实现时,本步骤在结合客户自身经济能力和风险偏好等基础条件下对推荐结果进行二次分析,在分析客户数据时,本***采用基于GraphX的连通图聚类算法,对客户人群进行有效分类,提高了推荐结果的准确性。
步骤4:将基金的投资方案推荐给用户A,该用户可以通过社交圈分享给用户B。
具体实现时,本步骤可以移动端微信推送或小程序为主,实现将客户的基金购买方案进一步推荐分享给社交圈好友,例如采用微信小程序中的Page中的onShareAppMessage(option)函数实现转发功能。
在步骤2中,如图3所示,在社交用户网络拓扑结构中加入背景节点“GroundNode”,并使该“Ground node”与图中所有节点实现双向互连,将原始的N节点M边的网络G(N,M)转换成拥有N+1个节点M+2N条边的强连通网络。新引入的节点使得图变的完全连通,同时也解决了节点影响力度量算法收敛性和跳转参数的问题。
引入Ground Node节点后,节点影响力的迭代公式如下图所示:
Figure BDA0002868343540000051
上式中,i,j=1,2,…,N+1。若节点i与节点j直接相连,则aij=1,否则为0,
Figure BDA0002868343540000052
表示节点j的出度,
Figure BDA0002868343540000053
表示节点i随机游走到节点j的概率。除背景节点外,所有节点初始值为LRi=1,背景节点g初始值为LRg=0。稳定状态下节点i的LR值为:
Figure BDA0002868343540000054
上式中,tc表示收敛次数,LRg(tc)为稳定状态下节点g的LR值。迭代结束后,每个节点获得一个稳定的影响力值,由于“Ground Node”不计入影响力排名,因此将其收敛后的影响力值平均分配给其他节点。
由此,进一步提出自适应用户影响力度量算法(Adaptive User Influence Rank,AUIR),如图4所示:
(1)每个节点跳转到其邻居节点的概率是相等的,各个节点无法根据实际邻居节点的属性行为自适应设置跳转概率。针对该问题,AUIR算法引入了自适应权重因子,自动分配用户节点到其邻居节点的转移概率,使得节点间转移具有一定的自适应特征。
(2)AUIR算法基于自适应权重因子,计算各个节点所占权重,差异性地分配“Ground Node”的值,进而更加精确地度量用户影响力值。
本算法在提出自适应权重因子的过程中,通过分析节点属性行为,考虑了三个因子,分别为节点间影响力、用户行为影响力以及基金热度话题影响力。
(1)节点间影响力
在有向社交网络中,节点的出度表示该节点的兴趣所向,入度表示其他节点对该节点的认可。若两个节点共同指向的节点数越多,则这两个节点兴趣越相似;若共同指向两个节点的节点数越多,则以上两个节点受认可度越高,且这两个节点的兴趣越相似。因此,若两个节点间共同的邻居节点越多,即两个节点共同指向的节点数越多,或者共同指向他们的节点数越多,则这两个节点越相似,节点间的转移概率越大。
在无向图中,常用Jaccard相似度系数来衡量两个节点的相似度,若Jaccard值越大,则相似度越大,公式如下所示:
Figure BDA0002868343540000061
考虑到在有向图中,节点相似度分别和其共同指向的节点数和共同指向其的节点数相关,将Jaccard度量公式改进如下式所示:
Figure BDA0002868343540000062
上式中,wn(i,j)表示节点间影响力,其值位于0和1之间,i、j分别为图中节点,n(i)in和n(j)in分别为共同指向i、j的节点数,n(i)out和n(j)out分别为i、j共同指向的节点数。
(2)用户行为影响力
在社交网络中,影响用户影响力大小的用户行为属性较多,本节选取较有代表性的五种属性,分别为:转发数、评论数、点赞数、粉丝数以及是否意见领袖。属性列表及其标识符具体列举如表1所示:
表1用户行为属性列表
Figure BDA0002868343540000071
此处将上表所列举的用户行为属性量化,提出如下所示的用户行为影响力度量公式,具体如式(5)所示:
Figure BDA0002868343540000072
上式中,Ai为用户i在统计周期内的发博频率,即其在统计周期内的活跃度。其中Mi为用户i在T周期内的发博数,T为统计周期。Ti表示用户i在指定周期内的传播能力,其中mj表示在周期T内用户i所发的任一博文,
Figure BDA0002868343540000073
表示博文mj的转发率,
Figure BDA0002868343540000074
分别为mj的评论率和点赞率。Ti包括用户i在指定时间段T内的平均点赞数,平均评论数以及平均转发数。用户活跃度越高,帖子传播能力越强,该用户的影响力越大。M为关注i的用户中,拥有最多粉丝的用户的粉丝值,V(i)表示i用户是否为大V用户,若为大V则为1,否则为0。a、b、c分别为各自的权重。
(3)基金热度话题影响力
社交网站的用户是具有话题偏向性的,即若用户所发博文与基金热度相关话题间的相似度越高,则该用户在此话题下的影响力越大。因此,本***获取某基金的热度话题,该话题T下的诸多新闻与用户所发博文间的余弦相似度,并将该值作为该用户的话题影响力wt(i)。若wt(i)值越大,则说明该用户与本话题更相关。一般而言,与话题相关度越高的用户更容易受到关注,且由其他节点转移至该节点的可能性更大。
为了解决影响力度量算法中每个节点无法自适应设置转移概率的问题,本发明将计算所得的节点间影响力、用户行为影响力以及话题影响力引入,提出自适应用户影响力度量算法——AUIR算法。该算法基于自适应权值因子,将节点转移概率加权处理,使得节点间转移时能够根据具体邻居节点的属性不同而具有一定的行为、节点以及话题偏向性。其中,AUIR算法的核心公式如下所示:
Figure BDA0002868343540000081
Figure BDA0002868343540000082
Figure BDA0002868343540000083
式(6)是自适应权值因子计算公式,其中j为i的邻居节点,wu(j)、wt(j)分别为用户j的用户行为影响力以及话题影响力,wn(i,j)为用户i与用户j的节点间影响力,m、n、k分别为用户行为影响力、话题影响力以及节点间影响力的权值。
式(7)中,若节点i与节点j直接相连,则aij=1,否则为0。该式为AUIR算法的迭代公式,在用户迭代过程中,加入自适应权值因子w(i,j),使得节点转移过程具有一定的节点、行为以及话题偏向性。
式(8)为稳定状态下节点i的AUIR值,迭代结束后,每个节点获得一个稳定的影响力值,由于“Ground Node”不计入影响力排名,传统的做法将其收敛后的影响力值平均分配给其他节点。但是鉴于各个节点具有差异性,本发明改进了式(2),将“Ground Node”收敛后的影响力值按照各个节点所占权重比例分配给各个节点。

Claims (5)

1.一种基于社交大数据的基金推荐方法,其特征在于,包括如下步骤:
(1)采集、处理用户的投资偏好信息及爬取金融社交网站用户的行为与舆情数据;
(2)构建动态的社交拓扑网络结构,设计自适应的用户影响力度量算法,对金融社交网站中热门的基金产品进行热度分析,具体步骤如下:
(2.1)在社交用户网络拓扑结构中加入背景节点Ground Node,并使该Ground node与图中所有节点实现双向互连,将原始的N节点M边的网络G(N,M)转换成拥有N+1个节点M+2N条边的强连通网络;
引入GroundNode节点后,节点影响力的迭代公式如下:
Figure FDA0003754949910000011
其中,i,j=1,2,…,N+1,当节点i与节点j直接相连,则aij=1,反之为aij=0,
Figure FDA0003754949910000012
表示节点j的出度,
Figure FDA0003754949910000013
表示节点i随机游走到节点j的概率;除背景节点外,所有节点初始值为LRi=1,背景节点g初始值为LRg=0;
稳定状态下节点i的影响力值公式如下:
Figure FDA0003754949910000014
上式中,tc表示收敛次数,LRg(tc)为稳定状态下节点g的LR值,迭代结束后,每个节点获得一个稳定的影响力值;
(2.2)将自适应用户影响力度量算法引入了自适应权重因子,所述自适应权重因子包括节点间影响力、用户行为影响力以及基金热度话题影响力;
所述节点间影响力的计算公式如下:
Figure FDA0003754949910000015
上式中,wn(i,j)表示节点间影响力,其值位于0和1之间,i、j分别为图中节点,n(i)in和n(j)in分别为指向i、j的节点数,n(i)out和n(j)out分别为i、j指向的节点数;
所述用户行为影响力的计算公式如下:
Figure FDA0003754949910000021
上式中,wu(i)表示用户行为影响力,Fans(i)表示粉丝数,Ai为用户i在统计周期内的发博频率,即其在统计周期内的活跃度,其中Mi为用户i在T周期内的发博数,T为统计周期,Ti表示用户i在指定周期内的传播能力,其中mj表示在周期T内用户i所发的任一博文,
Figure FDA0003754949910000022
表示博文mj的转发率,
Figure FDA0003754949910000023
分别为mj的评论率和点赞率,Ti包括用户i在指定时间段T内的平均点赞数,平均评论数以及平均转发数,用户活跃度越高,帖子传播能力越强,该用户的影响力越大,M为关注i的用户中,拥有最多粉丝的用户的粉丝值,V(i)表示i用户是否为大V用户,若为大V则为1,否则为0;a、b、c分别为各自的权重;
所述基金热度话题影响力通过获取某基金的热度话题,该话题T下的新闻与用户所发博文间的余弦相似度,并将该值作为该用户的话题影响力wt(i),自适应权值因子计算公式如下:
Figure FDA0003754949910000024
其中j为i的邻居节点,wu(j)、wt(j)分别为用户j的用户行为影响力以及话题影响力,wn(i,j)为用户i与用户j的节点间影响力,m、n、k分别为用户行为影响力、话题影响力以及节点间影响力的权值;
基于自适应权重因子的自适应用户影响力度量算法的迭代公式如下:
Figure FDA0003754949910000025
节点i与节点j直接相连,则aij=1,否则为0;在用户迭代过程中,加入自适应权值因子w(i,j),使得节点转移过程具有一定的节点、行为以及话题偏向性;
稳定状态下,节点i的基于自适应权重因子的AUIR值公式如下:
Figure FDA0003754949910000031
(3)根据当前市场平均市盈率值与历史高位、低位数值的比较来判断基金投资的风险大小;
(4)综合基金估值、市场风险分析及基金热度分析的结果,为客户及其社交圈好友筛选、推荐满足客户需求的基金产品。
2.根据权利要求1所述基于社交大数据的基金推荐方法,其特征在于:步骤(3)中,采集基金产品的实时净值估算、单位净值以及累计净值,并每日进行增量式爬取操作,根据当前市场平均市盈率值与历史高位、低位数值的比较来判断基金投资的风险大小。
3.根据权利要求1所述基于社交大数据的基金推荐方法,其特征在于:步骤(2)中,所述热度分析结合金融社交网站网民的情感指数;所述自适应的用户影响力度量算法,选取转发数、评论数、点赞数、粉丝数以及是否为意见领袖参数。
4.根据权利要求1所述基于社交大数据的基金推荐方法,其特征在于:步骤(4)中,将满足客户需求的投资方案推荐给客户,若推荐不满足则重复(2)(3)步骤调整组合;所述为客户推荐的基金产品同时还支持通过链接分享的形式让其社交圈好友进入平台后直接在现有方案上进行基金的购买。
5.根据权利要求1所述基于社交大数据的基金推荐方法的基金推荐***,其特征在于:包括金融社交大数据采集模块、基金热度分析模块、基金净值风险分析模块和基金筛选推荐模块;
所述金融社交大数据采集模块用于采集、处理用户的投资偏好信息及爬取金融社交网站用户的行为与舆情数据;
所述基金热度分析模块用于构建动态的社交拓扑网络结构,设计自适应的用户影响力度量算法,对金融社交网站中热门的基金产品进行热度分析;
所述基金净值风险分析模块用于根据当前市场平均市盈率值与历史高位、低位数值的比较来判断基金投资的风险大小;
所述基金筛选推荐模块用于综合基金估值、市场风险分析及基金热度分析的结果,为客户及其社交圈好友筛选、推荐满足客户需求的基金产品。
CN202011596610.4A 2020-12-29 2020-12-29 一种基于社交大数据的基金推荐***及方法 Active CN112612942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011596610.4A CN112612942B (zh) 2020-12-29 2020-12-29 一种基于社交大数据的基金推荐***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011596610.4A CN112612942B (zh) 2020-12-29 2020-12-29 一种基于社交大数据的基金推荐***及方法

Publications (2)

Publication Number Publication Date
CN112612942A CN112612942A (zh) 2021-04-06
CN112612942B true CN112612942B (zh) 2022-09-23

Family

ID=75248858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011596610.4A Active CN112612942B (zh) 2020-12-29 2020-12-29 一种基于社交大数据的基金推荐***及方法

Country Status (1)

Country Link
CN (1) CN112612942B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966189B (zh) * 2021-04-14 2024-01-26 北京基智科技有限公司 一种基金产品推荐***
CN113240472B (zh) * 2021-05-19 2024-02-02 深圳索信达数据技术有限公司 理财产品推荐方法、电子设备及存储介质
CN114154075B (zh) * 2022-02-08 2022-05-17 北京大氪信息科技有限公司 热门信息确定方法、装置、计算机设备和介质
CN115131155B (zh) * 2022-05-11 2023-12-19 李益非 一种基于投资管理的云平台

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373324B1 (en) * 1999-10-07 2008-05-13 Robert C. Osborne Method and system for exchange of financial investment advice
CN105117422A (zh) * 2015-07-30 2015-12-02 中国传媒大学 智能社交网络推荐***
CN107679239A (zh) * 2017-10-27 2018-02-09 天津理工大学 一种基于用户行为的个性化社区推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200357071A1 (en) * 2014-09-05 2020-11-12 Vested Interest Co. System and method for personal investing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373324B1 (en) * 1999-10-07 2008-05-13 Robert C. Osborne Method and system for exchange of financial investment advice
CN105117422A (zh) * 2015-07-30 2015-12-02 中国传媒大学 智能社交网络推荐***
CN107679239A (zh) * 2017-10-27 2018-02-09 天津理工大学 一种基于用户行为的个性化社区推荐方法

Also Published As

Publication number Publication date
CN112612942A (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
CN112612942B (zh) 一种基于社交大数据的基金推荐***及方法
US11070643B2 (en) Discovering signature of electronic social networks
Courtois et al. Farmer bargaining power and market information services
CN111125453B (zh) 基于子图同构的社交网络中意见领袖角色识别方法及存储介质
Yang et al. Friend or frenemy? Predicting signed ties in social networks
CN103377250B (zh) 基于邻域的top‑k推荐方法
CN111160992A (zh) 一种基于用户画像体系的营销***
CN105117422A (zh) 智能社交网络推荐***
CN104254851A (zh) 用于向用户推荐内容的方法和***
CN104254852A (zh) 用于混合信息查询的方法和***
CN102053971A (zh) 用于面向排序的协同过滤的推荐方法和设备
Xu et al. A novel approach to online social influence maximization
CN111143704B (zh) 一种融合用户影响关系的在线社区好友推荐方法及***
Wu et al. Optimization matrix factorization recommendation algorithm based on rating centrality
CN106997383A (zh) 基于PageRank算法的问题推荐方法及***
CN111695084A (zh) 模型生成方法、信用评分生成方法、装置、设备及存储介质
Zhang [Retracted] Optimization of the Marketing Management System Based on Cloud Computing and Big Data
Deng et al. Recommender system for marketing optimization
CN113672797A (zh) 一种内容推荐方法及装置
Liu et al. REDRL: A review-enhanced Deep Reinforcement Learning model for interactive recommendation
León et al. Tackling travel behaviour: an approach based on fuzzy cognitive maps
US20140280216A1 (en) Automated ranking of contributors to a knowledge base
JP4962950B2 (ja) ネットワーク上のユーザに対するレコメンデーションの方法、レコメンデーションサーバ及びプログラム
CN113449004A (zh) 数据匹配方法及装置
Pang et al. Community empowerment: Pro-poor tourism income distribution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant