CN106022522A - 一种基于互联网公开的大数据预测股票的方法及*** - Google Patents

一种基于互联网公开的大数据预测股票的方法及*** Download PDF

Info

Publication number
CN106022522A
CN106022522A CN201610338598.4A CN201610338598A CN106022522A CN 106022522 A CN106022522 A CN 106022522A CN 201610338598 A CN201610338598 A CN 201610338598A CN 106022522 A CN106022522 A CN 106022522A
Authority
CN
China
Prior art keywords
stock
data
days
day
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610338598.4A
Other languages
English (en)
Inventor
马健
俞扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201610338598.4A priority Critical patent/CN106022522A/zh
Publication of CN106022522A publication Critical patent/CN106022522A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开一种基于互联网公开的大数据预测股票的方法及***,首先爬取交易日前股票的相关信息;然后利用上步爬取的数据进行特征提取,构造训练数据集,并使用Group Lasso进行预测模型训练,所述模型的评价标准为按照每天开盘卖出上个交易日买入的股票,买进当前交易日推荐的股票这样的操作方式一段时间的收益率;再根据爬取交易日当天的数据构造新的测试集,并使用上步训练好的预测模型进行预测,得到最终推荐的股票。本发明为量化选股或股票预测提供了新的有用的可靠的信息来源,这些信息的加入结合传统的信息更加能反映市场,在此基础上使用机器学习技术得到的股票预测模型更加能够捕捉市场的内在运行机制,可以有效提高投资人的收益。

Description

一种基于互联网公开的大数据预测股票的方法及***
技术领域
本发明涉及一种大数据股票预测方法,特别涉及一种基于互联网公开的股民操作、分析师预测、股民评论、新闻、公告、历史股价、资金流向、基本面等大数据股票预测方法及***。
背景技术
上世纪70年代以前,股票投资是一种定性的分析,没有数据应用,而是一门主观的艺术。随着电脑的普及,很多人开始研究驱动股价变化的规律,把传统基本面研究方法用模型代替,市盈率、市净率的概念诞生,量化投资由此兴起。
从主观判断到量化投资,是从艺术转为科学的过程。上世纪70年代以前一个基本面研究员只能关注20只到50只股票,覆盖面很有限。有了量化模型就可以覆盖所有股票,这就是一个大的飞跃。此外,随着计算机处理能力的发展,信息的用量也有一个飞跃变化。过去看三个指标就够了,现在看的指标越来越多,做出的预测越来越准确。
随着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化竞争。各家机构的量化模型越来越趋同,导致投资结果同涨同跌。“能否在看到报表数据之前,用更大的数据寻找规律?”这是大数据策略创业者们试图解决的问题。
2013年诺贝尔经济学奖得主罗伯特·席勒于设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。
据此得出传统的股票预测都是基于股票价格的历史走势,资金流向,以及各股票的市值,市盈率等信息进行股票分析预测。在现在互联网深度影响诸多传统行业的情形下,相比于几十年前互联网还没发明前,乃至于互联网还没有这么普 及前,除了传统的那些股票数据外,互联网上还有很多关于股票的数据,包括公开数据的股民的实际操作、分析师的预测、股民的评论、新闻,公告等等信息。这些信息在一定程度上是对当前股市的反应,也会表现出对未来股市的预期的反应。本发明试图利用这些新的有用的数据以及传统的数据利用自然语言处理、机器学习等技术创造一种大数据股票预测模型。
发明内容:
发明目的:针对现有技术中存在的问题,本发明提出一种基于互联网上公开的股民和分析师操作行为的大数据量化选股方法及***,为广大股民,基金公司等做投资参考。
技术方案:本发明提出一种基于互联网公开的大数据预测股票的方法,包括如下步骤:
1)爬取交易日前股票的相关信息;
具体的爬取方法为:先爬取一些代理IP,而后使用Scrapy框架爬取相关网站的数据,将数据转化成json格式后存入Mongodb数据库中;
爬取的具体信息包括雪球网、金罗盘、股吧、凤凰财经、新浪财经等网站上关于股票的票的股民的股票操作、分析师的预测、股民评论、新闻、公告,以及每只股票的历史价格数据、市值、净资产收益率、资产收益率、每股收益增长率、流动负债比率、企业价值倍数、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的股价格收益率和波动率。
2)利用步骤1爬取的数据进行特征提取,构造训练数据集,并使用Group Lasso进行预测模型训练;
构造的训练数据集:由当前交易日的前一个星期的5个交易日的数据组成,对于这5个交易日的每个交易日,每只股票由特征和类别组成,其中特征用根据相关信息处理得到的向量表示,类别为下一个交易日该股票价格是否增涨,如果涨就为1否则为0,这样便得到初始训练矩阵;由于数据存在冗余,该步骤会先过滤掉信息量不足的数据,具体的过滤标准为:过滤掉爬取的数据中当日股民对股票的操作数低于10次的样本。
表征股票特征的向量的提取方法为:对于股民操作数据,按照股民的上个月收益率,将股民分为10个组,对每个等级的组提取该组对该股票的前1天、3 天、7天、15天、30天等时间戳中每个时间戳中的买进个数、卖出个数、持仓量、仓位改变量、该组在每个时间戳的平均收益率等特征;
对于分析师预测数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中的买进个数、卖出个数等特征;
对于股民评论数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的评论数,各个评论的情感值的均值,方差等特征;
对于新闻数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的新闻个数,各个新闻的情感值的均值,方差等特征;
对于公告数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的公告个数,各个公告中对应的公告关键词库中的词出现的次数的总和等特征;
对于历史股价数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的开盘价、收盘价、最高价、最低价、与前30日价格的比值、3日线斜率、7日线斜率、10日线斜率、15日线斜率、30日线斜率等特征;
对于资金流向数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票主力资金的流进量和流出量的比值等特征;
对于其他信息数据,提取该股票当前的市值、净资产收益率、资产收益率、每股收益增长率、流动负债比率、企业价值倍数、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的股价格收益率和波动率等特征;
对于股民评论、新闻、公告等文本数据首先基于金融情感词库、公告关键词库两个词库采用自然语言处理技术对文本进行分词,再根据文本中出现的金融情感词计算每条股民评论、新闻等的情感值,以及公告中相应关键词出现的的次数,金融情感词库中列举了一些股票情感关键词以及该关键词对应的情感得分,公告关键词库中列举了一些和公告相关的关键词,这两个词库是用过众包的方式人工标注得到的。
由于在特征提取中对于股民操作数据,按照股民的上个月收益率,将股民分为10个组,在此的每个组相当于一个分组(Group),每个分组内部的特征是有较强的关联的,而不同分组之间的特征间的关联性则没有那么强,在模型训练时,希望能对同一个分组内的特征有整体考虑的因素,在此基础上使用机器学习中的Group Lasso算法能够更好的考虑到这些因素,所以选用Group Lasso算法。
Group Lasso算法表示如下:
β ^ λ = arg min β ( | | Y - X β | | 2 2 + λ Σ g = 1 G | | β I g | | 2 )
其中,为模型训练结果,X为训练样本矩阵,Y为样本的类别向量,Ig表示属于第g个Group的特征索引,其中g=1,...,G,表示属于第g个Group的特征索引对应的模型训练出的权重结果的值。
在模型训练的过程中,利用交叉检验的方法,针对每一轮测试集根据预测的概率降序选取预测概率最高的股票,然后按照每天开盘卖出上个交易日买入的股票,买进当前交易日推荐的股票这样的操作方式两周时间总收益的收益率,以此调节模型的参数。
3)爬取交易日当天的数据构造新的测试集,并使用步骤2训练好的预测模型进行预测,得到最终推荐的股票。
本发明还提出一种基于互联网公开的大数据预测股票的***,包括数据爬取存储模块、预测模型训练模块和股票预测模块;其中,数据爬取存储模块用于爬取和存储股票的相关信息;预测模型训练模块利用交易日前爬取的数据构造训练数据集,并使用GroupLasso训练预测模型;股票预测模块,利用交易日当天爬取的数据构造新的测试集,并使用训练好的预测模型预测最终推荐的股票。
基于互联网公开数据的大数据预测股票的***还包括展示模块,用于将股票预测结果展示给客户。
有益效果:本发明为量化选股或股票预测提供了新的有用的可靠的信息来源,诸如股民的操作、分析师的预测、新闻、公告、研报等数据相对于传统的例如股票的历史价格、资金流向等数据是新型的数据来源,这些信息在一定程度上是对 当前股市的反应,也会表现出对未来股市的预期的反应。由于有大量的文本数据,这些数据的实时爬取和分析的难度比传统股票数据的爬取和处理要困难,本发明使用Scrapy框架爬虫和自然语言处理等技术针对这些类型的数据进行实时爬取和处理,以及和传统的例如股票的历史价格、资金流向等数据的结合更加能反映市场。由于本发明的提取的特征有些部分是按照股民的上个月收益率,将股民分为多个分组,每个分组内部的特征是有较强的关联的,而不同分组之间的特征间的关联性则没有那么强,在模型训练时,我们希望能对同一个分组内的特征有整体考虑的因素,在此基础上使用机器学习中的Group Lasso算法能够更好的考虑到这些因素,得到的股票预测模型更加能够捕捉市场的内在运行机制,大大提高了给资者带来的收益。
附图说明
图1为本发明的股票预测***的整体架构图;
图2为本发明的数据爬取存储模块的架构图;
图3为本发明的预测模型训练模块的架构图;
图4为本发明的股票预测预测模块的架构图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
图1为本发明的股票预测***的整体框架,包括四个模块,数据爬取存储模块、股票预测模型训练模块、股票预测模块和展示模块。本发明语言使用Python,数据库使用Mongodb。
数据爬取存储模块如图2所示,爬虫使用Scrapy框架,Scrapy是一个基于Python开发的快速、高层次的Web信息抓取***,主要用于自动访问相关Web站点并从页面中提取结构化的数据。Scrapy使用的是高效的Twisted异步网络库来处理网络通讯,Scrapy整体架构如图3所示。
在爬虫中,为了解决诸如雪球网等网站的防爬问题,先爬取一些代理IP,而后使用Scrapy框架爬取雪球网、金罗盘、股吧、凤凰财经、新浪财经、巨潮资 讯等网站的数据,将数据转化成json格式后存入Mongodb数据库中。其中,雪球网中可以爬取到一些股民的操作数据、股民评论、新闻、公告等数据,金罗盘可以爬取到分析师的预测等数据,股吧可以爬取到股民评论等数据,凤凰财经和新浪财经可以爬取到新闻以及股票的历史价格、资金流向、基本面等数据,巨潮资讯可以爬取到公告等数据。
股票预测模型训练模块如图4所示,先构造机器学习的训练数据集,训练数据集由距离当前交易日的前一个星期的5个交易日的数据组成。对于这5个交易日的每个交易日,A股2780只股票每只股票由特征和类别组成,其中特征用一个向量表示,该向量有700维左右,类别为下一个交易日该股票价格是否增涨,如果涨就为1否则为0,这样可以得到一个5*2780*701左右的矩阵。这是初始训练集。
表1 700维左右的特征向量的组成
由于有的股票某天爬取的数据不是很多,所以用原有的700维向量描述可能失真,所以股票预测模型训练模块会过滤掉信息量不足的数据,具体的过滤标准可以根据评价准则进行调节,现阶段本发明过滤掉爬取的数据中当日股民对股票的操作数低于10次的样本。这样可以得到过滤后训练集。
接着用机器学习中的Group Lasso算法进行模型训练,相同类型的统计量为一个Group。在此和传统的机器学习问题不同,这里的模型好坏的评价标准不是准确率、F1等,而是根据模型每天推荐8只股票、按照每天开盘卖出上个交易日买入的股票,买进当前交易日推荐的股票这样的操作方式这段时间的收益率。以此来调节模型的参数。Group Lasso算法表示如下:
β ^ λ = arg min β ( | | Y - X β | | 2 2 + λ Σ g = 1 G | | β I g | | 2 )
其中,为模型训练结果,X为训练样本矩阵,Y为样本的类别向量,Ig表示属于第g个Group的特征索引、其中g=1,...,G,表示属于第g个Group的特征索引对应的模型训练出的权重结果的值。
这样就得到了大数据股票预测模型,在每个交易日开盘前的10个小时左右,本发明进行当日模型的训练。
大数据股票预测模型的预测模块如图4所示,根据当日爬取的数据提取特征 得到测试数据集,这样可以得到A股2780只股票的2780条样本。再按照训练数据及过滤的方法,去除掉信息量少的样本,得到过滤后的测试集。最后使用训练好的大数据股票预测模型对过滤后的测试集进行预测,挑选输出概率最高的8只股票作为下个交易日的推荐股票。

Claims (9)

1.一种基于互联网公开的大数据预测股票的方法,包括如下步骤:
1)爬取交易日前股票的相关数据信息;
2)利用步骤1爬取的数据进行特征提取,构造训练集,并使用Group Lasso算法进行大数据股票预测模型的训练;
3)爬取交易日当天的数据构造新的测试集,并使用步骤2训练好的预测模型进行预测,得到最终推荐的股票。
2.根据权利要求1所述的基于互联网公开的大数据预测股票的方法,所述步骤1提取股票信息的方法为:先爬取一些代理IP,而后使用Scrapy框架爬取相关网站的数据,将数据转化成Json格式后存入Mongodb数据库中。
3.根据权利要求1所述的基于互联网公开的大数据预测股票的方法,所述步骤1爬取的具体信息包括雪球网、金罗盘、股吧、凤凰财经、新浪财经等网站上关于股票的股民的股票操作、分析师的预测、股民评论、新闻、公告,研报以及每只股票的价格历史数据、市值、净资产收益率、资产收益率、每股收益增长率、流动负债比率、企业价值倍数、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的股价格收益率和波动率。
4.根据权利要求1所述的基于互联网公开的大数据预测股票的方法,所述步骤2会过滤掉信息量不足的数据,具体的过滤标准为:过滤掉爬取的数据中当日股民对股票的操作数低于10次的样本。
5.根据权利要求1所述的基于互联网公开的大数据预测股票的方法,所述步骤2构造的训练数据集由当前交易日的前一个星期的5个交易日的数据组成,对于这5个交易日的每个交易日,每只股票由特征和类别组成,其中特征用根据相关信息处理得到的向量表示,类别为下一个交易日该股票价格是否增涨,如果涨就为1否则为0,这样便得到初始训练矩阵。
6.根据权利要求5所述的基于互联网公开的大数据预测股票的方法,所述表征股票特征的向量提取方法为:
对于股民操作数据,按照股民的上个月收益率,将股民分为10个组,对每个等级的组提取该组对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中的买进个数、卖出个数、持仓量、仓位改变量、该组在每个时间戳的平均收益率等特征;
对于分析师预测数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中的买进个数、卖出个数等特征;
对于股民评论数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的评论数,各个评论的情感值的均值,方差等特征;
对于新闻数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的新闻个数,各个新闻的情感值的均值,方差等特征;
对于公告数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的公告个数,各个公告中对应的公告关键词库中的词出现的次数的总和等特征;
对于历史股价数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票的开盘价、收盘价、最高价、最低价、与前30日价格的比值、3日线斜率、7日线斜率、10日线斜率、15日线斜率、30日线斜率等特征;
对于资金流向数据,提取分析师对该股票的前1天、3天、7天、15天、30天等时间戳中每个时间戳中该股票主力资金的流进量和流出量的比值等特征;
对于其他信息数据,提取该股票当前的市值、净资产收益率、资产收益率、每股收益增长率、流动负债比率、企业价值倍数、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的股价格收益率和波动率等特征;
对于股民评论、新闻、公告等文本数据首先基于金融情感词库、公告关键词库两个词库采用自然语言处理技术对文本进行分词,再根据文本中出现的金融情感词计算每条股民评论、新闻等的情感值,以及公告中相应关键词出现的的次数,金融情感词库中列举了一些股票情感关键词以及该关键词对应的情感得分,公告关键词库中列举了一些和公告相关的关键词,这两个词库是用过众包的方式人工标注得到的。
7.根据权利要求6所述的基于互联网公开的大数据预测股票的方法,由于在特征提取中对于股民操作数据,按照股民的上个月收益率,将股民分为10个组,在此的每个组相当于一个分组,每个分组内部的特征是有较强的关联的,而不同分组之间的特征间的关联性则没有那么强,为了能对同一个分组内的特征有整体的考虑,在此基础上使用机器学习中的Group Lasso算法进行预测模型训练,Group Lasso算法表示如下:
β ^ λ = arg min β ( | | Y - X β | | 2 2 + λ Σ g = 1 G | | β I g | | 2 )
其中,为模型训练结果,X为训练样本矩阵,Y为样本的类别向量,Ig表示属于第g个Group的特征索引,其中g=1,...,G,表示属于第g个Group的特征索引对应的模型训练出的权重结果的值;
在模型训练的过程中,利用交叉检验的方法,针对每一轮测试集根据预测的概率降序选取预测概率最高的股票,然后按照每天开盘卖出上个交易日买入的股票,买进当前交易日推荐的股票这样的操作方式两周时间总收益的收益率,以此调节模型的参数。
8.一种基于互联网公开的大数据预测股票的***,包括数据爬取存储模块、预测模型训练模块和股票预测模块;其中,数据爬取存储模块用于爬取和存储股票的相关信息;预测模型训练模块利用交易日前爬取的数据构造训练数据集,并使用Group Lasso训练预测模型;股票预测模块,利用交易日当天爬取的数据构造新的测试集,并使用训练好的预测模型预测最终推荐的股票。
9.根据权利要求8所述的基于互联网公开的大数据预测股票的***,还包括展示模块,用于将股票预测结果展示给客户。
CN201610338598.4A 2016-05-20 2016-05-20 一种基于互联网公开的大数据预测股票的方法及*** Pending CN106022522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610338598.4A CN106022522A (zh) 2016-05-20 2016-05-20 一种基于互联网公开的大数据预测股票的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610338598.4A CN106022522A (zh) 2016-05-20 2016-05-20 一种基于互联网公开的大数据预测股票的方法及***

Publications (1)

Publication Number Publication Date
CN106022522A true CN106022522A (zh) 2016-10-12

Family

ID=57096593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610338598.4A Pending CN106022522A (zh) 2016-05-20 2016-05-20 一种基于互联网公开的大数据预测股票的方法及***

Country Status (1)

Country Link
CN (1) CN106022522A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897932A (zh) * 2017-01-19 2017-06-27 沃民高新科技(北京)股份有限公司 数据置换方法及装置
CN107689000A (zh) * 2017-08-16 2018-02-13 北京国新汇金股份有限公司 一种财经信息管理***
CN108446984A (zh) * 2018-03-20 2018-08-24 张家林 一种投资数据管理方法及装置
CN108596765A (zh) * 2018-04-28 2018-09-28 国信优易数据有限公司 一种金融电子资源推荐方法和装置
CN108629690A (zh) * 2018-04-28 2018-10-09 福州大学 基于深度强化学习的期货量化交易***
CN108647823A (zh) * 2018-05-10 2018-10-12 北京航空航天大学 基于深度学习的股票数据分析方法和装置
CN108830722A (zh) * 2018-06-27 2018-11-16 东莞市波动赢机器人科技有限公司 基于对冲的交易机器人推荐方法、电子设备和存储介质
CN108921444A (zh) * 2018-07-12 2018-11-30 李俊山 基于区块链技术分布式数字交易所股指样本采集***
CN109087205A (zh) * 2018-08-10 2018-12-25 北京字节跳动网络技术有限公司 舆情指数的预测方法及装置、计算机设备和可读存储介质
CN109102319A (zh) * 2018-06-27 2018-12-28 众安信息技术服务有限公司 区块链加密资产的板块指数编制方法、装置和服务器
CN109146166A (zh) * 2018-08-09 2019-01-04 南京安链数据科技有限公司 一种基于投资者讨论内容打分的个股大跌预测模型
CN109255714A (zh) * 2018-08-27 2019-01-22 深圳市利讯互联网金融服务有限公司 机器学习基金优选***及其优选方法
CN109272405A (zh) * 2018-09-30 2019-01-25 大唐碳资产有限公司 碳资产交易方法及***
WO2019019346A1 (zh) * 2017-07-25 2019-01-31 上海壹账通金融科技有限公司 资产配置策略获取方法、装置、计算机设备和存储介质
WO2019041520A1 (zh) * 2017-08-31 2019-03-07 平安科技(深圳)有限公司 基于社交数据的金融产品推荐方法、电子装置及介质
CN109739895A (zh) * 2018-12-07 2019-05-10 中国联合网络通信集团有限公司 一种虚拟物品交易预测方法及装置
CN110163758A (zh) * 2019-06-03 2019-08-23 成都慧财智科技有限公司 人工智能股票投资分析***
WO2019192135A1 (zh) * 2018-04-03 2019-10-10 平安科技(深圳)有限公司 电子装置、债券收益率分析方法、***及存储介质
WO2019205378A1 (zh) * 2018-04-26 2019-10-31 平安科技(深圳)有限公司 基于舆情因子的投资选股方法、装置及存储介质
CN110400225A (zh) * 2019-07-29 2019-11-01 北京北信源软件股份有限公司 一种股票市值管理方法
WO2019218517A1 (zh) * 2018-05-16 2019-11-21 平安科技(深圳)有限公司 服务器、文本数据的处理方法及存储介质
WO2019242143A1 (zh) * 2018-06-21 2019-12-26 平安科技(深圳)有限公司 股票卖出预警方法、装置及计算机可读存储介质
CN110809778A (zh) * 2018-03-30 2020-02-18 加藤宽之 股价预测辅助***以及方法
TWI692735B (zh) * 2018-10-12 2020-05-01 台北富邦商業銀行股份有限公司 企業財務曝險管理系統

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897932A (zh) * 2017-01-19 2017-06-27 沃民高新科技(北京)股份有限公司 数据置换方法及装置
WO2019019346A1 (zh) * 2017-07-25 2019-01-31 上海壹账通金融科技有限公司 资产配置策略获取方法、装置、计算机设备和存储介质
CN107689000A (zh) * 2017-08-16 2018-02-13 北京国新汇金股份有限公司 一种财经信息管理***
WO2019041520A1 (zh) * 2017-08-31 2019-03-07 平安科技(深圳)有限公司 基于社交数据的金融产品推荐方法、电子装置及介质
CN108446984A (zh) * 2018-03-20 2018-08-24 张家林 一种投资数据管理方法及装置
CN110809778A (zh) * 2018-03-30 2020-02-18 加藤宽之 股价预测辅助***以及方法
WO2019192135A1 (zh) * 2018-04-03 2019-10-10 平安科技(深圳)有限公司 电子装置、债券收益率分析方法、***及存储介质
WO2019205378A1 (zh) * 2018-04-26 2019-10-31 平安科技(深圳)有限公司 基于舆情因子的投资选股方法、装置及存储介质
CN108596765A (zh) * 2018-04-28 2018-09-28 国信优易数据有限公司 一种金融电子资源推荐方法和装置
CN108629690A (zh) * 2018-04-28 2018-10-09 福州大学 基于深度强化学习的期货量化交易***
CN108647823A (zh) * 2018-05-10 2018-10-12 北京航空航天大学 基于深度学习的股票数据分析方法和装置
WO2019218517A1 (zh) * 2018-05-16 2019-11-21 平安科技(深圳)有限公司 服务器、文本数据的处理方法及存储介质
WO2019242143A1 (zh) * 2018-06-21 2019-12-26 平安科技(深圳)有限公司 股票卖出预警方法、装置及计算机可读存储介质
CN108830722A (zh) * 2018-06-27 2018-11-16 东莞市波动赢机器人科技有限公司 基于对冲的交易机器人推荐方法、电子设备和存储介质
CN109102319A (zh) * 2018-06-27 2018-12-28 众安信息技术服务有限公司 区块链加密资产的板块指数编制方法、装置和服务器
CN108921444A (zh) * 2018-07-12 2018-11-30 李俊山 基于区块链技术分布式数字交易所股指样本采集***
CN109146166A (zh) * 2018-08-09 2019-01-04 南京安链数据科技有限公司 一种基于投资者讨论内容打分的个股大跌预测模型
CN109087205A (zh) * 2018-08-10 2018-12-25 北京字节跳动网络技术有限公司 舆情指数的预测方法及装置、计算机设备和可读存储介质
CN109087205B (zh) * 2018-08-10 2020-09-18 北京字节跳动网络技术有限公司 舆情指数的预测方法及装置、计算机设备和可读存储介质
CN109255714A (zh) * 2018-08-27 2019-01-22 深圳市利讯互联网金融服务有限公司 机器学习基金优选***及其优选方法
CN109272405A (zh) * 2018-09-30 2019-01-25 大唐碳资产有限公司 碳资产交易方法及***
TWI692735B (zh) * 2018-10-12 2020-05-01 台北富邦商業銀行股份有限公司 企業財務曝險管理系統
CN109739895A (zh) * 2018-12-07 2019-05-10 中国联合网络通信集团有限公司 一种虚拟物品交易预测方法及装置
CN110163758A (zh) * 2019-06-03 2019-08-23 成都慧财智科技有限公司 人工智能股票投资分析***
CN110400225A (zh) * 2019-07-29 2019-11-01 北京北信源软件股份有限公司 一种股票市值管理方法

Similar Documents

Publication Publication Date Title
CN106022522A (zh) 一种基于互联网公开的大数据预测股票的方法及***
Bhowmik et al. Stock market volatility and return analysis: A systematic literature review
Meng et al. Reinforcement learning in financial markets
US20130138577A1 (en) Methods and systems for predicting market behavior based on news and sentiment analysis
Raman et al. Mapping ESG trends by distant supervision of neural language models
Brown et al. Financial statement adequacy and firms’ MD&A disclosures
Eisfeld Entry and acquisitions in software markets
Yin et al. Daily investor sentiment, order flow imbalance and stock liquidity: evidence from the Chinese stock market
Fang et al. Practical machine learning approach to capture the scholar data driven alpha in AI industry
CN116775975A (zh) 用于金融领域复杂新闻文本舆情分析的深度学习网络
Singh et al. FII flow and Indian stock market: A causal study
Li et al. Forecasting stock prices changes using long-short term memory neural network with symbolic genetic programming
Huang et al. Autonomous self-evolving forecasting models for price movement in high frequency trading: Evidence from Taiwan
Teplova et al. A retail investor in a cobweb of social networks
Eickhoff et al. Stock analysts vs. the crowd: a study on mutual prediction
Nguyen et al. News Sentiment and the Economy| Bulletin–June 2020
Carter et al. The IPO window of opportunity for digital product and service firms
Li Related research on news sentiment tendency and stock price fluctuation
Reintjes Automatic Identification and Classification of Share Buybacks and their Effect on Short-, Mid-and Long-Term Returns
Coiro Tesla: Is Now the Time to Invest? An examination of Tesla, social media, and its effect on stock
BEŞER et al. The impact of foreign direct investment on tax revenues: Evidence from selected transition economies
Puspita Sari INFLUENCE OF INVESTORS’ATTENTION ON STOCK RETURN, LIQUIDITY, AND RETURN VOLATILITY COMPARISON BETWEEN MANUFACTURE COMPANIES IN INDONESIA AND INDIA
Venturini The anatomy of the AI innovating sector in Europe
Raju et al. Machine Learning Algorithms for Prediction of Stock Market: A Systematic Literature Review
Fang et al. Practical Machine Learning Approach for Stock Trading Strategies using Alternative Dataset

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012

RJ01 Rejection of invention patent application after publication