CN112434083A - 一种基于大数据的事件处理方法和装置 - Google Patents

一种基于大数据的事件处理方法和装置 Download PDF

Info

Publication number
CN112434083A
CN112434083A CN202011380616.8A CN202011380616A CN112434083A CN 112434083 A CN112434083 A CN 112434083A CN 202011380616 A CN202011380616 A CN 202011380616A CN 112434083 A CN112434083 A CN 112434083A
Authority
CN
China
Prior art keywords
event
events
asset
profitability
calling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011380616.8A
Other languages
English (en)
Inventor
朱琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202011380616.8A priority Critical patent/CN112434083A/zh
Publication of CN112434083A publication Critical patent/CN112434083A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于大数据的事件处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理;根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率;触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。从而,本发明的实施方式能够解决现有事件识别率低、预测准确度差的问题。

Description

一种基于大数据的事件处理方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于大数据的事件处理方法和装置。
背景技术
目前,对事件的识别以及检测,都是人工手动的去抓取数据,然后根据经验对抓取的数据进行识别,确定事件,再根据确定的事件作出对应的处理。例如:搜集历史股票价格变化数据,凭借人工经验对未来的股票进行收益预测。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
人工手动的去抓取数据,效率过低,如果面对大量的数据则只能无能为力。同时,通过人工经验识别事件的效率太低,并且无法对事件进行精准的预测,也无法做出相应的处理。
发明内容
有鉴于此,本发明实施例提供一种基于大数据的事件处理方法和装置,能够解决现有事件识别率低、预测准确度差的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种基于大数据的事件处理方法,包括调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理;根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率;触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。
可选地,对所述事件基于预设标签进行标注,包括:
分别调用基本属性标签组件、政策标签组件和资产标签组件,对所述事件进行标注。
可选地,调用事件检测引擎根据标注后的事件执行聚类处理,包括:
随机选取一个事件,遍历剩余事件,计算选取事件与剩余事件的语义相似度;
如果语义相似度大于预设阈值,则剩余事件中的该事件与所述选取事件属于同一事件类簇。
可选地,根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,包括:
调用预设的事件的时间窗口模型,分别基于估计窗口、事件的时间窗口和事后窗口,获取所述同类型事件对应的交易数据。
可选地,调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率,包括:
获取基于估计窗口获取的交易数据,建立资产收益率与市场全类型资产指数的收益率的回归方程,进而通过基于事件的时间窗口获取的交易数据计算资产正常收益率。
可选地,通过基于事件的时间窗口获取的交易数据计算资产正常收益率之后,还包括:
获取所述资产在事件的时间窗口期间的实际收益率,以计算与所述资产正常收益率之间的差值,得到所述资产的超常收益率。
可选地,基于所述收益率计算得到累计超额收益率,包括:
调用预设的资产指数累计超额收益模型,根据所述资产的超常收益率计算累计超额收益率。
另外,本发明还提供了一种基于大数据的事件处理装置,包括检测模块,用于调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理;处理模块,用于根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率;预测模块,用于触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。
上述发明中的一个实施例具有如下优点或有益效果:本发明能够通过事件标签化、历史事件流聚类、相似事件聚类等功能将历史的类似某一特定事件进行分类检测;利用事件分析法,统计历史上发生的所有的类似的某一特定事件发生前后的一段时间内对特定大类资产指数变化,采用技术测量该类型事件对特定资产指数是否产生超额收益的定量分析,并可以做出未来类似事件发生后对特定大类资产指数变化的预测,以更好地、快速识别事件并提示事件风险。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明第一实施例的基于大数据的事件处理方法的主要流程的示意图;
图2是根据本发明实施例的事件的时间窗口的示意图;
图3是根据本发明第二实施例的基于大数据的事件处理方法的架构的示意图;
图4是根据本发明实施例的基于大数据的事件处理装置的主要模块的示意图;
图5是本发明实施例可以应用于其中的示例性***架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明第一实施例的基于大数据的事件处理方法的主要流程的示意图,如图1所示,所述基于大数据的事件处理方法包括:
步骤S101,调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理。
在一些实施例中,本发明将非结构化的事件信息进行结构化处理,并得到事件的发生时间、事件的市场情绪估值。具体地对所述事件基于预设标签进行标注的时候,可以分别调用基本属性标签组件、政策标签组件和资产标签组件,对所述事件进行标注。举例说明,基本属性标签组件可以包括事件开始时间、事件结束时间等等属性标签。政策标签组件可以包括财政政策,税收政策、国债资产、财政补贴政策、是否扩张性财政政策、是否紧缩性财政政策、是否中性财政政策;货币政策,降准政策、降息政策、升准政策、生息政策;中国政策、美国政策、欧盟政策,其他政策等属性标签。资产标签组件按照投资标的主要分为5大类,18个小类。其中,5个大类包括:货币类,固定收益类,权益类,商品类,其他类。18个小类包括:货币类、存款、代理国债、理财产品、代理基金、代理养老、代理保险、资管产品、代理信托、个人资金交易。
作为另一些实施例,调用事件检测引擎根据标注后的事件执行聚类处理的时候,具体地实施过程包括:随机选取一个事件,遍历剩余事件,计算选取事件与剩余事件的语义相似度。如果语义相似度大于预设阈值,则剩余事件中的该事件与所述选取事件属于同一事件类簇。也就是说,随机选择一个事件A,遍历剩余事件,计算事件A与剩余事件的语义相似度Sim。较佳的,采用余弦相似度计算语义相似度Sim。如果Sim大于预设阈值,则遍历的剩余事件中的事件B与事件A属于同一事件类簇。循环前述过程直至对于事件A而言,所有剩余事件遍历结束,从而可以对所有事件都采用前述过程进行聚类,即待聚类事件集为空。
值得说明的是,事件检测引擎可以配置两个子任务:事件类型分类和事件元素抽取。也就是说,事件检测引擎对聚类后的事件,还要进行事件元素抽取,并采用有监督的事件抽取,即将事件类型分类和事件元素抽取看作分类和序列标注问题处理。优选地,事件以元组的形式进行表示,如三元组<收购方、收购关系、被收购方>,而在对事件进行聚类时,则需要将事件映射在向量空间中。事件上下文词项用来表示事件(例如采用文本形式表示事件),或采用bag-of-words(也叫做“词袋”)、词向量等方式表示。
另外,根据事件的性质程度,将同类型的事件进行等级划分,从而实现事件多层次聚类。还有,本发明对事件通过主体进行关联,例如:主体可以为公司、行业或概念等等,利用主体把事件进行关联,可以查看某一主体在历史数据中所发生的所有事件。
例如,调用事件抽取引擎,获取宏观经济政策类型的新闻、公告中等非结构化数据进行标签化、相似事件聚类、历史事件流聚类,得到标签化的宏观经济政策历史集合数据。
步骤S102,根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率。
在一些实施例中,本发明进行了事件的时间窗口的定义,用于计算资产收益率的时间序列。从而根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,具体地实施过程包括:调用预设的事件的时间窗口模型,分别基于估计窗口、事件的时间窗口和事后窗口,获取所述同类型事件对应的交易数据。其中,如图2所示,估计窗口是指事件发生前的一段时间。事件的时间窗口是指事件发生时的一段时间。事后窗口是指在事件发生之后一段时间。同时,保证事前窗口、事件的时间窗口和事后窗口不重叠。
值得说明的是,不同的事件可以设置不同的跟踪时间窗口时间段,即可以设置事前窗口、事件的时间窗口和事后窗口中的任意一个或多个时间窗口。
进一步地实施例,调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率,可以包括:获取基于估计窗口获取的交易数据,建立资产收益率与市场全类型资产指数的收益率的回归方程,进而通过基于事件的时间窗口获取的交易数据计算资产正常收益率。另外,通过基于事件的时间窗口获取的交易数据计算资产正常收益率之后,可以获取所述资产在事件的时间窗口期间的实际收益率,以计算与所述资产正常收益率之间的差值,得到所述资产的超常收益率。
其中,资产指数正常收益率是指假设在事件的时间窗口期间事件没有发生的情况下产生的收益率。较佳地,在事件的时间窗口内产品i的正常收益率可以通过基于多因子变量的线性回归模型得到,即多因子预测正常收益可以利用历史数据,选取某些可能影响产品收益率波动的因子在一段时间内进行线性回归,最终确定这些因子的系数。具体地,定义Ri为产品i在时间序列t上的正常收益率向量。X为各因子在时间序列t上的取值矩阵。
Figure BDA0002808373850000061
为无风险收益率在时间序列t上的预期收益率向量。βi为产品i在因子上在时间序列t上的的暴露向量,εi为随机扰动向量。在事件的时间窗口内产品i的正常收益率计算公式:
Figure BDA0002808373850000062
其中,
Figure BDA0002808373850000071
Figure BDA0002808373850000072
假设因变量β是k个多元自变量X1,X2,...,Xk的线性函数。其中Rit表示产品i在被观察时间点t上的观测值,即产品i在各个观察时间点的收益率。而Xtk则是第k个自变量(即产品i收益率的第k个解释因子)在被观察时间点t上的观测值,βi是自变量X的系数,εi是第i组观测值的残差项。公式(1)展开来表示就是:
Figure BDA0002808373850000073
其中Xi=(Xi1...Xik)。
在同一只产品i上对事件的时间窗口样本内所有时间点利用最小二乘估计法对上式(2)进行回归,用参数估计法估计出
Figure BDA0002808373850000076
和βi。最小二乘估计法的思路是改变βi1...βik,使得残差的平方和最小。其参数估计结果为:
βi=(X'X)-1X'Ri (3)
值得说明的是,影响产品走势的因子(k)可以包括利率因子、准备金因子、社融因子、市场整体走势、估值因子、成长因子、盈利能力因子、杠杆因子、动量反转因子、交易因子、规模因子、股价因子、红利因子、股价波动因子、市场预期因子以及舆情情绪因子等等。各因子的取值按照因子的事件大小而有一个映射关系,因此对各因子的取值进行预先设置。例如:舆情情绪因子,当市场是正面积极情绪时取正数,当市场是负面消极情绪时取负数。舆情情绪因子影响范围是世界级的取值为5,亚洲市场的取值为4,国内市场的的取值为3,国内发达地区市场的取值为2,国内发达地区市场的取值为1。
将上述时间序列回归结果(3)在时序上取均值可得(下式中ET[]中下标T表示在时序上取均值),得到
Figure BDA0002808373850000074
的均值期望:
Figure BDA0002808373850000075
步骤S103,触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。
在一些实施例中,基于所述收益率计算得到累计超额收益率的时候,可以调用预设的资产指数累计超额收益模型,根据所述资产的超常收益率计算累计超额收益率。
也就是说,当类似事件再次发生时,通过事件主题语义分析自动匹配检索推理模型,可以根据事件上次发生时计算得到的小类资产指数累计超额收益率计算因本次类似事件而导致的该小类资产指数的累计超额收益率。根据估计计算得到的小类资产指数累计超额收益率来对本次事件产生后在事件的时间窗口期间对该小类资产做出增持或者减持的交易执行程序,以降低客户的风险,提高客户的收益率,即预测假设被观察样本事件发生后的某种特定金融资产在事件的时间窗口定义的事件影响时间内的预测收益率。其中,小类资产(产品i)指数预计累计超额收益率:
CARit’=U*CARit
U为根据本次事件与历史事件的影响范围差异、关联相似度而得到的修正参数。
资产(产品i)指数累计超额收益率CARit
Figure BDA0002808373850000081
CARit为资产指数在事件的时间窗口期[-j,j]个交易日的累计超额收益率,例如18个小类的资产指数。其中,超额收益率是用于计算被观察的特定资产实际收益率超出正常收益率的超额收益。
资产(产品i)指数超额收益率:
ARit=Rit’-Rit
Rit’为产品i的指数实际收益率:
Rit’=(Iit-Iit-1)/Iit-1
其中,It是指产品i的指数在t日的收盘指数,It-1是指产品i的指数在t-1日的收盘指数。
综上所述,本发明所述基于大数据的事件处理方法,可以自动从大量长期的数据源提取有效数据,识别各类型的所有事件,并对事件的后续影响进行分析,以规避有害风险,获取更为合适的事件处理对策。
图3是根据本发明第二实施例的基于大数据的事件处理方法的主要流程的示意图,所述基于大数据的事件处理方法包括:
步骤S301,调用事件抽取引擎,获取具体目标属性的历史事件。
步骤S302,分别调用基本属性标签组件、政策标签组件和资产标签组件,对所述事件进行标注。
步骤S303,调用事件检测引擎根据标注后的事件执行聚类处理。
步骤S304,调用预设的事件的时间窗口模型,分别基于估计窗口、事件的时间窗口和事后窗口,获取所述同类型事件对应的交易数据。
步骤S305,获取基于估计窗口获取的交易数据,建立资产收益率与市场全类型资产指数的收益率的回归方程,进而通过基于事件的时间窗口获取的交易数据计算资产正常收益率。
步骤S306,获取所述资产在事件的时间窗口期间的实际收益率,以计算与所述资产正常收益率之间的差值,得到所述资产的超常收益率。
步骤S307,触发监控程序,检测到同类型事件,进而调用预设的资产指数累计超额收益模型,根据所述资产的超常收益率计算累计超额收益率。
步骤S308,根据所述累计超额收益率获取相应的交易执行程序。
图4是根据本发明实施例的基于大数据的事件处理装置的主要模块的示意图,如图4所示,所述基于大数据的事件处理装置包括检测模块401、处理模块402和预测模块403。其中,检测模块401调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理;处理模块402根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率;预测模块403触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。
在一些实施例中,检测模块401对所述事件基于预设标签进行标注,包括:分别调用基本属性标签组件、政策标签组件和资产标签组件,对所述事件进行标注。
在一些实施例中,检测模块401调用事件检测引擎根据标注后的事件执行聚类处理,包括:随机选取一个事件,遍历剩余事件,计算选取事件与剩余事件的语义相似度;如果语义相似度大于预设阈值,则剩余事件中的该事件与所述选取事件属于同一事件类簇。
在一些实施例中,处理模块402根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,包括:调用预设的事件的时间窗口模型,分别基于估计窗口、事件的时间窗口和事后窗口,获取所述同类型事件对应的交易数据。
在一些实施例中,处理模块402调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率,包括:获取基于估计窗口获取的交易数据,建立资产收益率与市场全类型资产指数的收益率的回归方程,进而通过基于事件的时间窗口获取的交易数据计算资产正常收益率。
在一些实施例中,处理模块402通过基于事件的时间窗口获取的交易数据计算资产正常收益率之后,还包括:获取所述资产在事件的时间窗口期间的实际收益率,以计算与所述资产正常收益率之间的差值,得到所述资产的超常收益率。
在一些实施例中,预测模块403基于所述收益率计算得到累计超额收益率,包括:调用预设的资产指数累计超额收益模型,根据所述资产的超常收益率计算累计超额收益率。
需要说明的是,在本发明所述基于大数据的事件处理方法和所述基于大数据的事件处理装置在具体实施内容上具有相应关系,故重复内容不再说明。
图5示出了可以应用本发明实施例的基于大数据的事件处理方法或基于大数据的事件处理装置的示例性***架构500。
如图5所示,***架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备501、502、503可以是具有基于大数据的事件处理屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的基于大数据的事件处理方法一般由服务器505执行,相应地,计算装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机***600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有计算机***600操作所需的各种程序和数据。CPU501、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶基于大数据的事件处理器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的***中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括检测模块、处理模块和预测模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理;根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率;触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。
根据本发明实施例的技术方案,能够解决现有事件识别率低、预测准确度差的问题。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种基于大数据的事件处理方法,其特征在于,包括:
调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理;
根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率;
触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。
2.根据权利要求1所述的方法,其特征在于,对所述事件基于预设标签进行标注,包括:
分别调用基本属性标签组件、政策标签组件和资产标签组件,对所述事件进行标注。
3.根据权利要求1所述的方法,其特征在于,调用事件检测引擎根据标注后的事件执行聚类处理,包括:
随机选取一个事件,遍历剩余事件,计算选取事件与剩余事件的语义相似度;
如果语义相似度大于预设阈值,则剩余事件中的该事件与所述选取事件属于同一事件类簇。
4.根据权利要求1所述的方法,其特征在于,根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,包括:
调用预设的事件的时间窗口模型,分别基于估计窗口、事件的时间窗口和事后窗口,获取所述同类型事件对应的交易数据。
5.根据权利要求4所述的方法,其特征在于,调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率,包括:
获取基于估计窗口获取的交易数据,建立资产收益率与市场全类型资产指数的收益率的回归方程,进而通过基于事件的时间窗口获取的交易数据计算资产正常收益率。
6.根据权利要求5所述的方法,其特征在于,通过基于事件的时间窗口获取的交易数据计算资产正常收益率之后,还包括:
获取所述资产在事件的时间窗口期间的实际收益率,以计算与所述资产正常收益率之间的差值,得到所述资产的超常收益率。
7.根据权利要求6所述的方法,其特征在于,基于所述收益率计算得到累计超额收益率,包括:
调用预设的资产指数累计超额收益模型,根据所述资产的超常收益率计算累计超额收益率。
8.一种基于大数据的事件处理装置,其特征在于,包括:
检测模块,用于调用事件抽取引擎,获取具体目标属性的历史事件,对所述事件基于预设标签进行标注,进而调用事件检测引擎根据标注后的事件执行聚类处理;
处理模块,用于根据预设的事件的时间窗口模型,获取所述同类型事件对应的交易数据,进而调用预设的资产类型收益模型,基于所述交易数据计算得到对应资产类型的收益率;
预测模块,用于触发监控程序,检测到同类型事件,进而基于所述收益率计算得到累计超额收益率,以根据所述累计超额收益率获取相应的交易执行程序。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202011380616.8A 2020-11-30 2020-11-30 一种基于大数据的事件处理方法和装置 Pending CN112434083A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011380616.8A CN112434083A (zh) 2020-11-30 2020-11-30 一种基于大数据的事件处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011380616.8A CN112434083A (zh) 2020-11-30 2020-11-30 一种基于大数据的事件处理方法和装置

Publications (1)

Publication Number Publication Date
CN112434083A true CN112434083A (zh) 2021-03-02

Family

ID=74698608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011380616.8A Pending CN112434083A (zh) 2020-11-30 2020-11-30 一种基于大数据的事件处理方法和装置

Country Status (1)

Country Link
CN (1) CN112434083A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781101A (zh) * 2021-08-09 2021-12-10 深圳市惟客数据科技有限公司 基于实时计算的事件中心管理方法、装置及可读介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781101A (zh) * 2021-08-09 2021-12-10 深圳市惟客数据科技有限公司 基于实时计算的事件中心管理方法、装置及可读介质

Similar Documents

Publication Publication Date Title
CN111145009A (zh) 用户贷后风险评估方法、装置及电子设备
CN111783039B (zh) 风险确定方法、装置、计算机***和存储介质
CN111582314A (zh) 目标用户确定方法、装置及电子设备
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
CN110942392A (zh) 一种业务数据处理方法、装置、设备和介质
CN115238815A (zh) 异常交易数据获取方法、装置、设备、介质和程序产品
CN114997975A (zh) 一种异常企业识别方法、装置、设备、介质及产品
CN112434083A (zh) 一种基于大数据的事件处理方法和装置
CN112950359A (zh) 一种用户识别方法和装置
CN116664306A (zh) 风控规则的智能推荐方法、装置、电子设备及介质
CN111429257B (zh) 一种交易监控方法和装置
CN115482094A (zh) 一种业务处理方法、装置、电子设备及计算机可读介质
CN115795345A (zh) 信息处理方法、装置、设备及存储介质
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
CN115994819A (zh) 风险客户识别方法、装置、设备和介质
CN114066513A (zh) 一种用户分类的方法和装置
CN113901817A (zh) 文档分类方法、装置、计算机设备和存储介质
CN112990311A (zh) 一种准入客户的识别方法和装置
CN116797024A (zh) 业务处理方法、装置、电子设备和存储介质
CN116562974A (zh) 对象识别方法、装置、电子设备及存储介质
CN116450950A (zh) 产品组合推荐方法、装置、设备及介质
CN114693421A (zh) 风险评估方法、装置、电子设备和介质
CN115455298A (zh) 目标物品确定方法、装置、电子设备及存储介质
CN117911033A (zh) 交易限额确定方法、装置、设备、介质及程序产品
CN117011051A (zh) 业务处理方法及装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination