CN112561699A - 一种券商客户数据的处理方法、***及存储介质 - Google Patents

一种券商客户数据的处理方法、***及存储介质 Download PDF

Info

Publication number
CN112561699A
CN112561699A CN202011459341.7A CN202011459341A CN112561699A CN 112561699 A CN112561699 A CN 112561699A CN 202011459341 A CN202011459341 A CN 202011459341A CN 112561699 A CN112561699 A CN 112561699A
Authority
CN
China
Prior art keywords
mobile phone
data
account
community
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011459341.7A
Other languages
English (en)
Inventor
程彪
林永峰
沈彦
李禹汉
罗晖霞
魏永东
杨衍鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanzheng Technology Shenzhen Co ltd
Original Assignee
Shanzheng Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanzheng Technology Shenzhen Co ltd filed Critical Shanzheng Technology Shenzhen Co ltd
Priority to CN202011459341.7A priority Critical patent/CN112561699A/zh
Publication of CN112561699A publication Critical patent/CN112561699A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及一种券商客户数据的处理方法、服务器及存储介质,属于数据处理技术领域。该分析方法包括:(1)接收同一券商的柜台用户账户数据、柜台用户交易数据、终端应用用户账户数据及终端应用用户交易数据;(2)基于所接收的账户数据,以手机号码或手机号与客户编号组合所构成编号区分实际控制人;(3)于柜台用户交易数据与终端应用用户交易数据,将不同实际控制人的交易行为归类至其编号名下,以获取不同实际控制人的交易数据;(4)基于交易数据,统计不同实际控制人的活跃程度。该分析方法更准确地对券商用户的数据进行分析,以为客户提供更好的服务,可广泛用于券商客户分析领域中。

Description

一种券商客户数据的处理方法、***及存储介质
技术领域
本发明涉及大数据技术领域,具体地说,涉及一种券商客户数据的处理方法、***及存储介质。
背景技术
金融公司为了能更好地服务客户及保护客户,通常都会对用户数据进行加工、整理及挖掘,例如公开号为CN111427658A的专利文献公开了一种处理金融数据的***及方法,其根据用户对多媒体内容的行为数据确定用户对多媒体内容传播的贡献,从而便于确定用户的价值,进而为用户分配虚拟资源,通过将虚拟资源信息写入区块链网络中,从而实现将用户虚拟资源分配的去中心化存储。此外,如公开号为CN107657524A的专利文献公开了一种基于风控管理的数据处理方法,其通过对终端设备风险事件的自动识别和处理,而增强了终端设备的安全性与可靠性。
金融公司在为客户提供服务与保护客户的同时,还需对用户数据进行分析,以能转化部分客户;其中,一个较为有效的数据分析模型为数据漏斗分析。而在这些金融公司中,券商为了能更好地服务客户,不仅开设柜台,还开发终端应用与管理股票社区,以从多个途径为客户提供多角度、立体化的服务;但由此也给数据分析过程带来了许多问题,例如终端应用、柜台及股票设计在使用过程中均会所产生大量数据,且三者所产生的数据之间通常会存在断层,导致分析结构难以反映券商用户的实际情况,不仅无法为券商客户提供更好的服务,且难以转化部分潜在客户。
此外,对于散户而言,由于其不具有专业的分析能力,而使其交易行为容易受网络信息影响,尤其受股票社区里面的信息影响,特别是在这些股票社区里存在相关信息发布托。
发明内容
本发明的主要目的是提供一种券商客户数据处理方法、***及存储介质,以通过该处理方法,能更准确地对券商用户的数据进行分析,以为客户提供更好的服务;
本发明的另一目的是提供一种券商客户数据处理方法、***及存储介质,以通过该处理方法,能更准确地对券商用户的数据进行分析,以为客户提供更好的服务,尤其是能提供风险提示。
为了实现上述主要目的,本发明提供的券商客户数据分析方法包括以下步骤:
数据接收步骤,至少接收同一券商的柜台用户账户数据、柜台用户交易数据、终端应用用户账户数据及终端应用用户交易数据;
关联分类步骤,基于所接收的账户数据,获取与同一手机号码绑定的资金账户,及与同一客户编号绑定的资金账号;并基于手机号码与客户编号及资金账号之间的关联关系,以手机号码或手机号与客户编号组合所构成编号区分实际控制人;
行为归类步骤,基于柜台用户交易数据与终端应用用户交易数据,将不同实际控制人的交易行为归类至其编号名下,以获取不同实际控制人的交易数据;
活跃度分析步骤,基于交易数据,统计不同实际控制人的活跃程度。
在上述技术方案中,通过融合柜台与终端应用上的账户信息与交易信息,在根据手机号码、资金账号与客户编号之间的关联关系,获取账号实际控制人,从而对每个实际控制人所控制的交易行为进行监控与统计,从而能够更好地对不同实际控制人的交易活跃程度进行评价,以能更好地对不同客户提供针对***。
具体的方案为以手机号码或手机号与客户编号组合所构成的编号表征实际控制人的步骤包括以下步骤:(1)若无资金账户或客户编号与某一手机号码关联时,则以该手机号码表征对应实际控制人的编号;(2)若无其他手机号码与某一手机号码同时共有资金账户及客户编号时,则以该手机号码表征对应实际控制人的编号;(3) 若无其他客户编号与某一客户编号同时共有多个资金账户及多个客户编号时,则以该客户编号表征对应实际控制人的编号;(4)否则,以客户编号与手机号码的组合表征对应实际控制人的编号。该技术方案将所有客户分为4大类,从而能更精确地对不同客户的交易行为进行归类。
优选的方案为上述券商客户数据分析方法还包括客户分类步骤:依据活跃程度的评价结果从高到低进行排序,并按照预设等级范围对不同实际控制人进行分类。
为了实现上述主要目的,本发明提供的券商客户数据分析***包括处理器与存储器,存储器存储有计算机程序;其中,当该计算机程序被处理器执行时,能实现上述任一技术方案所描述的券商客户数据分析方法。
为了实现上述主要目的,本发明提供的计算机可读存储介质存储有用于对券商客户数据进行分析的计算机程序;其中,当该计算机程序被执行时,能实现上述任一技术方案所描述的券商客户数据分析方法。
为了实现上述主要目的,本发明提供的券商客户数据分析方法包括以下步骤:
数据接收步骤,至少接收同一券商的柜台用户账户数据、柜台用户交易数据、终端应用用户账户数据、终端应用用户交易数据、股票社区用户账户数据及股票社区用户行为数据;股票社区用户行为数据包括用户网页浏览内容与用户网页浏览数据,和/或用户信息发布数据与用户信息发布内容;
关联分类步骤,基于所接收的账户数据,获取与同一手机号码绑定的资金账户,与同一客户编号绑定的资金账号,及与同一手机号码关联的社区用户账号;并以手机号码作为实际控制人编号,基于手机号码与客户编号及资金账号之间的关联关系,对手机号码进行号码分类;号码分类包括有资金账号及客户编号与其对应的第一类手机号码,及无资金账号且无客户编号与其对应的第二类手机号码;
数据处理步骤,基于语义分析算法对股票社区用户行为数据中的浏览内容和/或发布内容进行分析,并对不同类的内容对象按类标识;再基于股票社区用户行为数据中浏览数据和/或发布数据,对不同类的内容对象进行统计分析;
风险提示步骤,若存有与第一类手机号码相关联的社区用户账号浏览与其所持有股票相关联信息的总时长超过第一预定时长,和/ 或浏览与其所持有股票相关联信息的数量超过第一预定数量,和/或发布与其所持有股票相关联信息并收到回复时;则基于语义分析算法分析该社区账号所浏览的前述社区信息内容,以识别出前述社区信息内容对该第一类手机号码所关联实际控制人所持有的股票的风险评价结果,若在数据库中对该股票的风险等级标识与风险评价结果相反,则向该社区用户账户所关联的手机号码发送风险提示信息。
在上述技术方案中,通过融合柜台、终端应用及股票社区上的数据,以根据手机号码、资金账号与客户编号之间的关联关系,获取账号实际控制人,从而对每个实际控制人所控制的交易行为进行监控与统计,并对其在股票社区上的行为进行监控,从而辨识出相关控制人是否存在受网络上的不准确信息影响而进行有损害***易行为,尤其是没有专业辨识能力的小型散户,以能更好地对不同客户提供服务。
具体的方案为风险提示信息包括谨慎参考网络信息,以相关公告为准。
优选的方案为上述风险提示步骤包括以下步骤:基于前述数据处理步骤中所统计出的结果,若存有与第一类手机号码相关联的社区账户浏览第一股票关联信息的总时长超过第二预定时长,和/或浏览第一股票相关联信息的数量超过第二预定数量,和/或发布与第一股票相关联信息并收到回复时;则基于语义分析算法分析该社区账号所浏览的前述社区信息内容,以识别出该社区信息内容对第一股票的风险评价结果,若在数据库中对第一股票的风险等级标识与该风险评价结果相反,且收到该社区账户所关联的资金账户委托购买第一股票时,则向该社区用户账户所关联的手机号码发送风险提示信息。该技术方案能够进一步地提高客户在交易过程中的风险警示能力。
优先的方案为在第一类手机号码中,优先对手机号码、资金账户及客户编号一一对应的实际控制人的交易行为进行风险提示。此类控制人通常为小型散户,他们所具备的风险辨识能力通常较低。
优先的方案为上述基于语义分析算法对股票社区用户行为数据进行分析的步骤包括以下步骤:(1)获取社区账户所浏览社区信息中文本信息与图片信息,并将识别出图片信息中的文本信息;(2) 基于所获取的所有文本信息,并基于股票代码、股票名称、名称拼音、公司实控人所构成的关键词组,识别出该社区账户所浏览社区信息内容所关联的股票,并以该股票的识别标志对该社区信息内容进行标识分类;(3)并将由同一股票的识别标志所标识的所有浏览信息内容归类至该股票名下。
优选的方案为上述基于语义分析算法识别出股票的风险评价结果的步骤包括以下步骤:基于关键词设置,区分不同浏览信息内容的评价结果,评价结果包括持有、买入及卖出;并以不同类型的评价结果次数占高者作为最终评级结果。
为了实现上述主要目的,本发明提供的券商客户数据分析***包括处理器与存储器,存储器存储有计算机程序;其中,当该计算机程序被处理器执行时,能实现上述任一技术方案所描述的券商客户数据分析方法。
为了实现上述主要目的,本发明提供的计算机可读存储介质存储有用于对券商客户数据进行分析的计算机程序;其中,当该计算机程序被执行时,能实现上述任一技术方案所描述的券商客户数据分析方法。
附图说明
图1为本发明实施例1中券商客户数据分析方法的工作流程图;
图2为本发明实施例1中手机号码与客户编号及资金账号间关系对照表;
图3为本发明实施例1中手机号码与客户编号及资金账号间的第一种关系示意图;
图4为本发明实施例1中手机号码与客户编号及资金账号间的第二种关系示意图;
图5为本发明实施例1中手机号码与客户编号及资金账号间的第三种关系示意图;
图6为本发明实施例1中手机号码与客户编号及资金账号间的第四种关系示意图;
图7为本发明实施例1中手机号码与客户编号及资金账号间的第五种关系示意图;
图8为本发明实施例1中手机号码与客户编号及资金账号间的第六种关系示意图;
图9为本发明实施例1中手机号码与客户编号及资金账号间的第七种关系示意图。
具体实施方式
以下结合实施例及其附图对本发明作进一步说明。
实施例1
在本实施例中,所要处理的数据包括属于同一券商的终端应用数据与柜台数据,以克服在现有技术中所存在的终端应用与柜台之间的数据断层问题;其中,在业务上,对于客户数据,券商又有三个内部ID,分别为手机号码、资金账号与客户编号,且一个手机号码通常可以绑定多个资金账号,而券商无法完成手机号码与资金账号的实名验证,而对于不同业务类型的资金账号,在柜台上的客户编号是一致的;即券商在数据分析过程中,存在以下问题:(1)手机账号与资金账号之间天然地存在一对多的关系;(2)客户通过手机号码可以关联其他人的资金账号进行交易;(3)前述三个ID不都一定等同于实际控制人,即难以知道具体是谁在操作相关账户。
参见图1,本发明券商客户数据分析方法包括数据接收步骤S1、关联分类步骤S2、行为归类步骤S3及活跃度分析步骤S4,具体过程如下:
数据接收步骤S1,通过通信线路,至少接收同一券商的柜台用户账户数据、柜台用户交易数据、终端应用用户账户数据及终端应用用户交易数据。
其中,终端应用包括安装在台式电脑、笔记本、平板电脑、智能手机等终端上的APP;“通信线路”被配置为线路等有线通信线路、蓝牙等无线通信连接或二者的组合,用于使服务器接收柜台电脑等设备所接收的客户账户信息与客户交易信息,及终端应用所接收的客户账户信息与客户交易信息。
关联分类步骤S2,基于所接收的账户数据,获取与同一手机号码绑定的资金账户,及与同一客户编号绑定的资金账号;并基于手机号码与客户编号及资金账号之间的关联关系,以手机号码或手机号与客户编号组合所构成编号区分实际控制人。
在获取客户账户信息之后,基于智能手机的普及与在账户注册过程中均需留下手机号码,此外客户在柜台开设账户过程中,都会为其配置客户编号;因此,在本实施例中采用手机号码和/或客户编号作为实际控制人的编号,以期能将不同交易数据归类至不同实际控制人的名下,以便于后续能对实际控制人的行为进行分析。
经对申请人的客户账户信息进行统计分析可知,在账户信息中,手机号码、资金账号与客户编号之间的关系包括其中,具体如图2 所示;因此,在该步骤中,以手机号码或手机号与客户编号组合所构成的编号表征实际控制人的步骤具体包括以下步骤:
(1)若无资金账户或无客户编号与某一手机号码关联时,即如图3所示,在该手机号码所对应的客户名下无资金账号,也无客户编号,则以该手机号码表征对应实际控制人的编号。
(2)若无其他手机号码与某一手机号码同时共有资金账户及客户编号时,则以该手机号码表征对应实际控制人的编号。在该步骤中,存在两种情况;(2.1)如图4所示,在该手机号码所对应的客户名下仅有一个资金账号与一个客户编号,且一一对应;(2.2)如图5所示,在该手机号码所对应的客户名下有多个资金账号及一个客户编号,即一个客户编号与一个手机号码均对应同样的多个资金账户。
(3)若无其他客户编号与某一客户编号同时共有多个资金账户及多个手机号码时,则以该客户编号表征对应实际控制人的编号。在该步骤中,共存在两种情况,具体为:(3.1)如图6所示,在该客户编号上存有多个资金账户与之对应,且每个资金账号各与一个手机号码一一对应;(3.2)如图7所示,在该客户编号上存有多个资金账户与之对应,且每个资金账号各与一个手机号码或多个手机号码对应,并存在资金账号与手机号码交叉关联的关系。
(4)除了上述三种情况,即五种关系之外,以客户编号与手机号码的组合表征对应实际控制人的编号,从而能够更好地区别对应实际控制人;在该步骤中,共存在两种情况,具体为:(4.1)如图 8所示,在同一手机号码一下,存有多个资金账号与之关联,且每个资金账号下仅有一个客户编号与之一一对应;(4.2)如图9所示,在存在多个手机号码、多个资金账号及多个客户编号相关联,且一个资金账号仅与一个客户编号一一对应,而每个资金账号与多个手机号码关联,并存在资金账号与手机号码交叉关联的关系。
行为归类步骤S3,基于柜台用户交易数据与终端应用用户交易数据,将不同实际控制人的交易行为归类至其编号名下,以获取不同实际控制人的交易数据。
在该步骤中,基于之前所标识的分类,对不同的实际控制人的交易数据进行归类统计。
活跃度分析步骤S4,基于交易数据,统计不同实际控制人的活跃程度。
在该步骤中,可以采用预设的统计时间段内的交易次数、交易总额、均次交易额等作为活跃程度的评价指标,也可以将它们按预设权重求均值作为活跃程度的评价指标;也可按照行业现有评价指标进行统计计算活跃程度。
实施例2
作为对本发明实施例2的说明,以下仅对与上述实施例1的不同之处进行说明,具体为该券商客户数据分析方法还包括以下步骤:
客户分类步骤,依据活跃程度的评价结果从高到低进行排序,并按照预设等级范围对不同实际控制人进行分类。
对于预设等级的设置,可以根据当月的评价结果按照数量进行区分,也可以根据历史统计数据进行区分。
实施例3
在本实施例中,所要处理的数据包括属于同一券商的终端应用数据、柜台数据与股票社区数据,以克服在现有技术中所存在的终端应用、柜台与股票社区之间的数据断层问题;其中,在业务上,对于客户数据,券商又有三个内部ID,分别为手机号码、资金账号与客户编号,且一个手机号码通常可以绑定多个资金账号,而券商无法完成手机号码与资金账号的实名验证,而对于不同业务类型的资金账号,在柜台上的客户编号是一致的;即券商在数据分析过程中,存在以下问题:(1)手机账号与资金账号之间天然地存在一对多的关系;(2)客户通过手机号码可以关联其他人的资金账号进行交易;(3)前述三个ID不都一定等同于实际控制人,即难以知道; (4)客户在股票社区上的账号通常跟手机关联,难以将其股票交易行为受股票社区的内容影响进行监控。
本发明券商客户数据分析方法包括数据接收步骤S21、关联分类步骤S22、数据处理步骤S23及风险提示步骤S24,具体过程如下:
数据接收步骤S21,至少接收同一券商的柜台用户账户数据、柜台用户交易数据、终端应用用户账户数据、终端应用用户交易数据、股票社区用户账户数据及股票社区用户行为数据。
其中,股票社区用户行为数据包括用户网页浏览内容与用户网页浏览数据,和/或用户信息发布数据与用户信息发布内容,在本实施例中,浏览内容与发布内容包括图片内容与文本内容,一个客户对于同一条内容所在页面在预定时长内重复打开或重复发布,其浏览数据与发布数据仅算一次,但超过该预设时间为按具体次数进行计算,例如以早上8点至12点为一个统计区间,下午12点至 17:30点为一个统计时间,而晚上的17:30-早上8:00为一个统计区间。
终端应用包括安装在台式电脑、笔记本、平板电脑、智能手机等终端上的APP;“通信线路”被配置为线路等有线通信线路、蓝牙等无线通信连接或二者的组合,用于使服务器接收柜台电脑等设备所接收的客户账户信息与客户交易信息,及终端应用所接收的客户账户信息与客户交易信息。
关联分类步骤S22,基于所接收的账户数据,获取与同一手机号码绑定的资金账户,与同一客户编号绑定的资金账号,及与同一手机号码关联的社区用户账号;并以手机号码作为实际控制人编号,基于手机号码与客户编号及资金账号之间的关联关系,对手机号码进行号码分类。
其中,号码分类包括有资金账号及客户编号与其对应的第一类手机号码,及无资金账号且无客户编号与其对应的第二类手机号码。分为该两种账号的原因是便于将其在社区上的行为与其交易行为进行关联处理之后,以判断其交易行为是否受社区内容的影响,而判断其交易行为是否存在风险。
在该步骤中,先利用手机号码或手机号与客户编号组合所构成的编号表征实际控制人,再利用与该编号相关联的手机号码进行表征,如果手机号码超过两个以上,则对两个手机号码都进行警示,。从而便于对实际控制人的数据获取与统计;具体步骤包括以下步骤:
(1)若无资金账户或无客户编号与某一手机号码关联时,即如图3所示,在该手机号码所对应的客户名下无资金账号,也无客户编号,则以该手机号码表征对应实际控制人的编号。
(2)若无其他手机号码与某一手机号码同时共有资金账户及客户编号时,则以该手机号码表征对应实际控制人的编号。在该步骤中,存在两种情况;(2.1)如图4所示,在该手机号码所对应的客户名下仅有一个资金账号与一个客户编号,且一一对应;(2.2)如图5所示,在该手机号码所对应的客户名下有多个资金账号及一个客户编号,即一个客户编号与一个手机号码均对应同样的多个资金账户。
(3)若无其他客户编号与某一客户编号同时共有多个资金账户及多个手机号码时,则以该客户编号表征对应实际控制人的编号。在该步骤中,共存在两种情况,具体为:(3.1)如图6所示,在该客户编号上存有多个资金账户与之对应,且每个资金账号各与一个手机号码一一对应;(3.2)如图7所示,在该客户编号上存有多个资金账户与之对应,且每个资金账号各与一个手机号码或多个手机号码对应,并存在资金账号与手机号码交叉关联的关系。
(4)除了上述三种情况,即五种关系之外,以客户编号与手机号码的组合表征对应实际控制人的编号,从而能够更好地区别对应实际控制人;在该步骤中,共存在两种情况,具体为:(4.1)如图 8所示,在同一手机号码一下,存有多个资金账号与之关联,且每个资金账号下仅有一个客户编号与之一一对应;(4.2)如图9所示,在存在多个手机号码、多个资金账号及多个客户编号相关联,且一个资金账号仅与一个客户编号一一对应,而每个资金账号与多个手机号码关联,并存在资金账号与手机号码交叉关联的关系。
数据处理步骤S23,基于语义分析算法对股票社区用户行为数据中的浏览内容和/或发布内容进行分析,并对不同类的内容对象按类标识;再基于股票社区用户行为数据中浏览数据和/或发布数据,对不同类的内容对象进行统计分析。具体地,数据处理过程具体包括以下步骤:
(1)获取社区账户所浏览社区信息中文本信息与图片信息,并将识别出图片信息中的文本信息。
在该步骤中,对于社区所呈现的内容信息,其载体包括图片信息与文本信息,因此需先将图片信息中所包含的文本信息进行识别,例如图片中包括某股票的代码、名称等,即对该股票的评价结果,需先基于ORC进行文本识别,再进行文本关键词的比对统计。
(2)基于所获取的所有文本信息,并基于股票代码、股票名称、名称拼音、公司实控人所构成的关键词组,识别出该社区账户所浏览社区信息内容所关联的股票,并以该股票的识别标志对该社区信息内容进行标识分类。
在该步骤中,通过对同一条信息内容中文本内容是否出现前述股票代码、股票名称、名称拼音与一个股票信息唯一指示的关键词判断该信息内容是否涉及该股票。对于具体关键词组的设定可以采用调查方式进行获取,并进行人工筛选之后作为关键词,以进行判断。
并基于常规关键词对该信息对股票的评级对该信息内容进行标识,主要标识为“持有”、“买入”或|“卖出”等,例如“强烈要求买入”、“好消息”等应认为其所传递的信息为“买入”,“建议观察之后再做决定”应认为其所传递的信息为“持有”,或者“赶紧逃”之类的关键词组应认为其所传递的信息为“卖出”;具体关键词可以采用调查方式进行获取,并进行人工筛选之后作为关键词,以进行判断。
对于不同信息内容所属股票及其“买入”、“卖出”与“持有”评级可以基于经大量样本进行训练之后的神经网络模型进行分类识别,对于样本可以基于人工对当前社区内的所有相关信息内容进行标识之后,再进行训练。
(3)并将由同一股票的识别标志所标识的所有浏览信息内容归类至该股票名下。
风险提示步骤S24,若存有与第一类手机号码相关联的社区用户账号浏览与其所持有股票相关联信息的总时长超过第一预定时长,和/或浏览与其所持有股票相关联信息的数量超过第一预定数量,和 /或发布与其所持有股票相关联信息并收到回复时;则基于语义分析算法分析该社区账号所浏览的前述社区信息内容,以识别出前述社区信息内容对该第一类手机号码所关联实际控制人所持有的股票的风险评价结果,若在数据库中对该股票的风险等级标识与风险评价结果相反,则向该社区用户账户所关联的手机号码发送风险提示信息。
其中,风险提示信息包括谨慎参考网络信息,以相关公告为准。
具体过程为基于关键词设置,区分不同浏览信息内容的评价结果,评价结果包括持有、买入及卖出;并以不同类型的评价结果次数占比高者作为最终评级结果。
在上述实施例中,“第一预定时长”与“第一预定数量”根据实际情况进行设置,例如可以根据该客户的风险评测结果进行具体设置,例如所能承担风险系数越高这,“第一预定时长”与“第一预定数量”可以设置得大一些。
在该步骤中,为了增加散户的风险警示作用,在第一类手机号码中,优先对手机号码、资金账户及客户编号一一对应的实际控制人的交易行为进行风险提示。
实施例4
作为对本发明实施例4的说明,以下仅对与上述实施例3的不同之处进行说明,具体为该券商客户数据分析方法的风险提示步骤 S24还包括以下步骤:
基于数据处理步骤S23中所统计出的结果,若存有与第一类手机号码相关联的社区账户浏览第一股票关联信息的总时长超过第二预定时长,和/或浏览第一股票相关联信息的数量超过第二预定数量,和/或发布与第一股票相关联信息并收到回复时;则基于语义分析算法分析该社区账号所浏览的前述社区信息内容,以识别出该社区信息内容对第一股票的风险评价结果,若在数据库中对第一股票的风险等级标识与该风险评价结果相反,且收到该社区账户所关联的资金账户委托购买第一股票时,则向该社区用户账户所关联的手机号码发送风险提示信息。
在该步骤中,通过对客户股票交易行为之前的社区行为数据的统计结果进行判断,分析客户当前的交易委托受其在社区内所浏览信息的影响,从而对其的交易风险进行提示,具体为若券商自身通过调查所获取的信息认为其当前所委托交易的股票评级为“买入”,而其所浏览信息的统计结果为偏向“卖出”时,可以进行风险提示;而评级相同时,则不对客户进行风险提示,以免对客户的交易行为造成误导。
在上述实施例中,“第二预定时长”与“第二预定数量”根据实际情况进行设置,例如可以根据该客户的风险评测结果进行具体设置,例如所能承担风险系数越高这,“第二预定时长”与“第二预定数量”可以设置得大一些。

Claims (11)

1.一种券商客户数据处理方法,其特征在于,所述券商客户数据分析方法包括以下步骤:
数据接收步骤,至少接收同一券商的柜台用户账户数据、柜台用户交易数据、终端应用用户账户数据及终端应用用户交易数据;
关联分类步骤,基于所接收的账户数据,获取与同一手机号码绑定的资金账户,及与同一客户编号绑定的资金账号;并基于手机号码与客户编号及资金账号之间的关联关系,以手机号码或手机号与客户编号组合所构成编号区分实际控制人;
行为归类步骤,基于所述柜台用户交易数据与所述终端应用用户交易数据,将不同实际控制人的交易行为归类至其编号名下,以获取不同实际控制人的交易数据;
活跃度分析步骤,基于所述交易数据,统计不同实际控制人的活跃程度。
2.根据权利要求1所述的券商客户数据处理方法,其特征在于,所述以手机号码或手机号与客户编号组合所构成的编号表征实际控制人的步骤包括以下步骤:
若无资金账户或客户编号与某一手机号码关联时,则以该手机号码表征对应实际控制人的编号;
若无其他手机号码与某一手机号码同时共有资金账户及客户编号时,则以该手机号码表征对应实际控制人的编号;
若无其他客户编号与某一客户编号同时共有多个资金账户及多个手机号码时,则以该客户编号表征对应实际控制人的编号;
否则,以客户编号与手机号码的组合表征对应实际控制人的编号。
3.根据权利要求1或2所述的券商客户数据处理方法,其特征在于,所述券商客户数据分析方法还包括以下步骤:
客户分类步骤,依据所述活跃程度的评价结果从高到低进行排序,并按照预设等级范围对不同实际控制人进行分类。
4.一种券商客户数据处理方法,其特征在于,包括以下步骤:
数据接收步骤,至少接收同一券商的柜台用户账户数据、柜台用户交易数据、终端应用用户账户数据、终端应用用户交易数据、股票社区用户账户数据及股票社区用户行为数据;所述股票社区用户行为数据包括用户网页浏览内容与用户网页浏览数据,和/或用户信息发布数据与用户信息发布内容;
关联分类步骤,基于所接收的账户数据,获取与同一手机号码绑定的资金账户,与同一客户编号绑定的资金账号,及与同一手机号码关联的社区用户账号;并以手机号码作为实际控制人编号,基于手机号码与客户编号及资金账号之间的关联关系,对所述手机号码进行号码分类;所述号码分类包括有资金账号及客户编号与其对应的第一类手机号码,及无资金账号且无客户编号与其对应的第二类手机号码;
数据处理步骤,基于语义分析算法对所述股票社区用户行为数据中的浏览内容和/或发布内容进行分析,并对不同类的内容对象按类标识;再基于所述股票社区用户行为数据中浏览数据和/或发布数据,对不同类的内容对象进行统计分析;
风险提示步骤,若存有与所述第一类手机号码相关联的社区用户账号浏览与其所持有股票相关联信息的总时长超过第一预定时长,和/或浏览与其所持有股票相关联信息的数量超过第一预定数量,和/或发布与其所持有股票相关联信息并收到回复时;则基于语义分析算法分析该社区账号所浏览的前述社区信息内容,以识别出所述前述社区信息内容对该第一类手机号码所关联实际控制人所持有的股票的风险评价结果,若在数据库中对该股票的风险等级标识与所述风险评价结果相反,则向该社区用户账户所关联的手机号码发送风险提示信息。
5.根据权利要求4所述的券商客户数据处理方法,其特征在于:
所述风险提示信息包括谨慎参考网络信息,以相关公告为准。
6.根据权利要求4或5所述的券商客户数据处理方法,其特征在于,所述风险提示步骤包括:
基于所述数据处理步骤中所统计出的结果,若存有与所述第一类手机号码相关联的社区账户浏览第一股票关联信息的总时长超过第二预定时长,和/或浏览所述第一股票相关联信息的数量超过第二预定数量,和/或发布与所述第一股票相关联信息并收到回复时;则基于语义分析算法分析该社区账号所浏览的前述社区信息内容,以识别出该社区信息内容对所述第一股票的风险评价结果,若在数据库中对所述第一股票的风险等级标识与该风险评价结果相反,且收到该社区账户所关联的资金账户委托购买所述第一股票时,则向该社区用户账户所关联的手机号码发送风险提示信息。
7.根据权利要求4至6任一项权利要求所述的券商客户数据处理方法,其特征在于:
在所述第一类手机号码中,优先对手机号码、资金账户及客户编号一一对应的实际控制人的交易行为进行风险提示。
8.根据权利要求4至7任一项权利要求所述的券商客户数据处理方法,其特征在于,所述数据处理步骤包括以下步骤:
获取社区账户所浏览社区信息中文本信息与图片信息,并将识别出所述图片信息中的文本信息;
基于所获取的所有文本信息,并基于股票代码、股票名称、名称拼音、公司实控人所构成的关键词组,识别出该社区账户所浏览社区信息内容所关联的股票,并以该股票的识别标志对该社区信息内容进行标识分类;
并将由同一股票的识别标志所标识的所有浏览信息内容归类至该股票名下。
9.根据权利要求4至8任一项权利要求所述的券商客户数据处理方法,其特征在于,所述风险提示步骤包括以下步骤:
基于关键词设置,区分不同浏览信息内容的评价结果,所述评价结果包括持有、买入及卖出;并以不同类型的评价结果次数占比高者作为最终评级结果。
10.一种券商客户数据处理***,包括处理器与存储器,所述存储器存储有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,能实现权利要求1至9任一项权利要求所述的券商客户数据处理方法。
11.一种计算机可读存储介质,特征在于,所述计算机可读存储介质存储有用于对券商客户数据进行分析的计算机程序,当所述计算机程序被执行时,能实现权利要求1至9任一项权利要求所述的券商客户数据处理方法。
CN202011459341.7A 2020-12-11 2020-12-11 一种券商客户数据的处理方法、***及存储介质 Pending CN112561699A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011459341.7A CN112561699A (zh) 2020-12-11 2020-12-11 一种券商客户数据的处理方法、***及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011459341.7A CN112561699A (zh) 2020-12-11 2020-12-11 一种券商客户数据的处理方法、***及存储介质

Publications (1)

Publication Number Publication Date
CN112561699A true CN112561699A (zh) 2021-03-26

Family

ID=75062420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011459341.7A Pending CN112561699A (zh) 2020-12-11 2020-12-11 一种券商客户数据的处理方法、***及存储介质

Country Status (1)

Country Link
CN (1) CN112561699A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168438A (zh) * 2022-09-07 2022-10-11 中国中金财富证券有限公司 成交回报数据整合方法及相关装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798604A (zh) * 2017-09-28 2018-03-13 平安科技(深圳)有限公司 基于机器学习的择时入股方法及终端设备
CN108268451A (zh) * 2018-03-13 2018-07-10 中国科学院大学 一种股票情感指数构建方法及***
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN109345391A (zh) * 2018-10-17 2019-02-15 山东儒名投资集团有限公司 基于大数据分析的风险控制方法及***
CN110060047A (zh) * 2019-03-28 2019-07-26 阿里巴巴集团控股有限公司 基于交易的信用风险判别方法及其装置
CN110084010A (zh) * 2019-04-28 2019-08-02 宁波深擎信息科技有限公司 一种券商行业的用户行为归一方法、***、设备及介质
CN110209944A (zh) * 2019-06-10 2019-09-06 上海时廊人工智能科技有限公司 一种股票分析师推荐方法、装置、计算机设备和存储介质
CN110851485A (zh) * 2018-07-25 2020-02-28 百度在线网络技术(北京)有限公司 社交关系的挖掘方法及装置、计算机设备与可读介质
CN111260368A (zh) * 2020-01-08 2020-06-09 支付宝(杭州)信息技术有限公司 一种账户交易风险判断方法、装置及电子设备
CN111967971A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 银行客户数据处理方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798604A (zh) * 2017-09-28 2018-03-13 平安科技(深圳)有限公司 基于机器学习的择时入股方法及终端设备
CN108268451A (zh) * 2018-03-13 2018-07-10 中国科学院大学 一种股票情感指数构建方法及***
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN110851485A (zh) * 2018-07-25 2020-02-28 百度在线网络技术(北京)有限公司 社交关系的挖掘方法及装置、计算机设备与可读介质
CN109345391A (zh) * 2018-10-17 2019-02-15 山东儒名投资集团有限公司 基于大数据分析的风险控制方法及***
CN110060047A (zh) * 2019-03-28 2019-07-26 阿里巴巴集团控股有限公司 基于交易的信用风险判别方法及其装置
CN110084010A (zh) * 2019-04-28 2019-08-02 宁波深擎信息科技有限公司 一种券商行业的用户行为归一方法、***、设备及介质
CN110209944A (zh) * 2019-06-10 2019-09-06 上海时廊人工智能科技有限公司 一种股票分析师推荐方法、装置、计算机设备和存储介质
CN111260368A (zh) * 2020-01-08 2020-06-09 支付宝(杭州)信息技术有限公司 一种账户交易风险判断方法、装置及电子设备
CN111967971A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 银行客户数据处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168438A (zh) * 2022-09-07 2022-10-11 中国中金财富证券有限公司 成交回报数据整合方法及相关装置

Similar Documents

Publication Publication Date Title
CN107784067B (zh) 监察信息处理方法、装置、服务器和存储介质
CN107657500B (zh) 股票推荐方法及服务器
CN109711955B (zh) 基于当前订单的差评预警方法、***、黑名单库建立方法
CN112668859A (zh) 基于大数据的客户风险评级方法、装置、设备及存储介质
CN112926699A (zh) 异常对象识别方法、装置、设备及存储介质
CN109284369B (zh) 证券新闻资讯重要性的判定方法、***、装置及介质
CN109961309B (zh) 业务推荐方法和***
CN112990386B (zh) 用户价值聚类方法、装置、计算机设备和存储介质
CN111552680A (zh) 业务欺诈识别数据库的构建方法、装置和计算机设备
KR102228737B1 (ko) Ai를 이용한 가짜뉴스 판독 방법 및 장치
CN111369369A (zh) 一种微盘交易平台监控***和方法
CN110503567B (zh) 数据校验方法、设备、存储介质及装置
CN115577172A (zh) 物品推荐方法、装置、设备及介质
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
CN112561699A (zh) 一种券商客户数据的处理方法、***及存储介质
CN114118793A (zh) 一种地方交易所风险预警方法、装置及设备
CN111429110B (zh) 门店标准化审核方法、装置、设备及存储介质
CN112950359A (zh) 一种用户识别方法和装置
CN112651733A (zh) 渠道路由选择方法、装置、设备及存储介质
CN111782908A (zh) 一种基于数据挖掘聚类分析的web违规操作行为检测方法
CN112712270B (zh) 信息处理方法、装置、设备及存储介质
CN112866295B (zh) 一种大数据防爬虫处理方法及云平台***
CN115713399A (zh) 一种结合第三方数据源的用户信用评估***
CN112036730B (zh) 一种虚拟资产数据处理方法、装置及计算机可读存储介质
CN114154556A (zh) 样本预测模型的训练方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination