CN108711073A - 用户分析方法、装置及终端 - Google Patents
用户分析方法、装置及终端 Download PDFInfo
- Publication number
- CN108711073A CN108711073A CN201810459561.6A CN201810459561A CN108711073A CN 108711073 A CN108711073 A CN 108711073A CN 201810459561 A CN201810459561 A CN 201810459561A CN 108711073 A CN108711073 A CN 108711073A
- Authority
- CN
- China
- Prior art keywords
- short message
- user
- service provider
- interactive
- title
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种用户分析方法、装置及终端,该方法,包括:获取互动型短信;从所述互动型短信中提取出服务提供方的名称;根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。本发明实现了对用户需求的精准分析,从而便于提供针对性的营销策略,提高营销效果。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户分析方法、装置及终端。
背景技术
随着通信技术的发展,移动通信服务已经渗透到生活的方方面面,而为了实现对用户进行精准营销,通信业务运营商需要对用户的需求进行分类。
目前,通信业务运营商往往是通过设置一系列的限制条件来对用户进行分类,而这些分类方式几乎都是基于对用户手机号码关联的消费情况以及网络使用情况的分析得到的。
但是,单个用户可能同时具有多个手机号码,若单纯针对不同手机号码的消费情况以及网络使用情况来对用户进行分类,会存在较大的分析误差,从而影响用户分类结果的准确性。
发明内容
本发明提供一种用户分析方法、装置及终端,以实现对用户需求的精准分析,从而便于提供针对性的营销策略。
第一方面,本发明实施例提供一种用户分析方法,包括:
获取互动型短信;
从所述互动型短信中提取出服务提供方的名称;
根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。
可选地,所述获取互动型短信,包括:
获取用户在预设周期内的所有短信记录;
从所述短信记录中筛选出包含验证码的短信作为互动型短信。
可选地,所述从所述互动型短信中提取出服务提供方的名称,包括:
判断所述互动型短信是否为格式化短信;其中,格式化短信是指短信文本的首字符串中包含有预设标注符号;
若所述互动型短信为格式化短信,则直接从所述格式化短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称;
若所述互动型短信为非格式化短信,则对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称。
可选地,所述对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称,包括:
按照词性将所述非格式化短信划分为N个待检测字段,N为大于0的自然数;
将所述待检测字段与预设字典中的参考字段进行匹配,得到与所述参考字段匹配的目标字段,将所述目标字段作为所述非格式化短信对应的服务提供方的名称。
可选地,在按照词性将所述非格式化短信划分为若干个待检测字段之后,还包括:
若所述预设字典中不存在与所述待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中;
获取预设周期内所述预设集合中所有分词词组之间的相似度;
将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数;
分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段;
对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。
可选地,所述根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别,包括:
对预设周期内提取到的服务提供方的名称进行分类;
统计在预设周期内,所述用户收到每一类服务提供方发送的所述互动型短信的频率;
根据不同类别服务提供方的影响权重和频率,获取用户的稳定性评分;
根据所述稳定性评分,获得所述用户所属的类别。
可选地,还包括:
根据各用户所属的类别,向不同类别的用户推送不同的营销策略。
第二方面,本发明实施例提供一种用户分析装置,包括:
获取模块,用于获取互动型短信;
提取模块,用于从所述互动型短信中提取出服务提供方的名称;
分析模块,用于根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。
可选地,所述获取模块,具体用于:
获取用户在预设周期内的所有短信记录;
从所述短信记录中筛选出包含验证码的短信作为互动型短信。
可选地,所述提取模块,具体用于:
判断所述互动型短信是否为格式化短信;其中,格式化短信是指短信文本的首字符串中包含有预设标注符号;
若所述互动型短信为格式化短信,则直接从所述格式化短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称;
若所述互动型短信为非格式化短信,则对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称。
可选地,所述提取模块,具体用于:
按照词性将所述非格式化短信划分为N个待检测字段,N为大于0的自然数;
将所述待检测字段与预设字典中的参考字段进行匹配,得到与所述参考字段匹配的目标字段,将所述目标字段作为所述非格式化短信对应的服务提供方的名称。
可选地,还包括:
处理模块,用于在按照词性将所述非格式化短信划分为若干个待检测字段之后,若所述预设字典中不存在与所述待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中;
获取预设周期内所述预设集合中所有分词词组之间的相似度;
将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数;
分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段;
对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。
可选地,分析模块,具体用于:
对预设周期内提取到的服务提供方的名称进行分类;
统计在预设周期内,收到每一类服务提供方发送的所述互动型短信的频率;
根据不同类别服务提供方的影响权重和频率,获取用户的稳定性评分;
根据所述稳定性评分,获得所述用户所属的类别。
可选地,还包括:
营销模块,用于各用户所属的类别,向不同类别的用户推送不同的营销策略。
第三方面,本发明实施例提供一种终端,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如第一方面中任一项所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,包括:计算机程序,当其在计算机上运行时,使得计算机执行第一方面中任一所述的方法。
本发明提供的用户分类方法、装置及终端,通过获取互动型短信;从所述互动型短信中提取出服务提供方的名称;根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。本发明实现了对用户需求的精准分析,从而便于提供针对性的营销策略,提高营销效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的应用场景的结构示意图;
图2为本发明实施例一提供的用户分析方法的流程图;
图3为图2实施例中步骤S102的方法流程图;
图4为本发明实施例二提供的用户分析装置的结构示意图;
图5为本发明实施例三提供的用户分析装置的结构示意图;
图6为本发明实施例四提供的终端的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
以下,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解:
1)终端是指:向用户提供语音和/或数据连通性的设备,例如具有无线和/或有线连接功能的手持设备、车载设备等。常见的终端包括:手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备、可穿戴设备,例如智能手表、智能手环、计步器等。
图1为本发明实施例提供的应用场景的结构示意图,如图1所示,用户的终端接收到一条互动型短信,其内容为“【滴滴打车】您在申请开通XX服务,验证码为XXXX”。互动型短信是指由用户向服务提供方发送了服务请求,而服务提供方向用户反馈包含验证码信息的短信。一般情况下,服务提供方反馈的包含验证码信息的短信是按照标准格式编辑的。例如图1所示,服务提供方为滴滴打车,短信中以符号“【】”内的内容来标注服务提供方的名称。这种按照标准格式编辑的互动型短信定义为格式化短信。与格式化短信对应的,还有不按照标准格式编辑的互动型短信,定义为非格式化短信。例如内容为:“滴滴打车提醒:您在申请开通XX服务,验证码为XXXX”;在该条互动短信中没有以符号“【】”来标注出服务提供方的名称。针对非格式化短信,在提取服务提供方的名称时,就要对非格式化短信的内容进行分词处理,从分词结果中提取出服务提供方的名称。本发明实施例中服务提供方的名称可以是机构名称、企业名称、APP名称、网站名称等等。根据对格式化互动型短息、非格式化互动型短信的分析,可以精确地获取到用户的消费行为,从而实现根据用户的消费行为对用户进行分类,以便于营销商针对不同类别的用户执行不同的营销策略。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本发明实施例一提供的用户分析方法的流程图,如图2所示,本实施例中的方法可以包括:
S101、获取互动型短信。
可选地,获取用户在预设周期内的所有短信记录;从所述短信记录中筛选出包含验证码的短信作为互动型短信。
本实施例中,可以从用户终端的本地存储器,或者从电信运营商的云端存储器中获取用户在预设周期内的短信记录,并从中筛选出包含验证码的短信,将包含验证码的短信作为互动型短信。具体地,可以通过关键字检索的方式,从短信息中查找是否包含有验证码。预设周期的设定可以根据实际需要进行灵活调整,例如以月或者季度作为一个预设周期。
S102、从所述互动型短信中提取出服务提供方的名称。
本实施例中,当筛选出互动型短信之后,还需要判断所述互动型短信是否为格式化短信;其中,格式化短信是指短信文本的首字符串中包含有预设标注符号。例如图1中所示的以符号“【】”内的内容来标注服务提供方的名称。需要说明的是,本实施例仅以符号“【】”为例进行说明,但是不限定具体的符号形式和数量。
可选地,若所述互动型短信为格式化短信,则直接从所述格式化短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称;
若所述互动型短信为非格式化短信,则对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称。
可选地,按照词性将所述非格式化短信划分为N个待检测字段,N为大于0的自然数;将所述待检测字段与预设字典中的参考字段进行匹配,得到与所述参考字段匹配的目标字段,将所述目标字段作为所述非格式化短信对应的服务提供方的名称。
本实施例中,假设收到的非格式化短信内容为“XXA企业给您发送的验证码,验证码为8888”,则进行分词处理之后得到10个待检测字段“XXA/企业/给/您/发送/的/验证码/验证码/为/8888”。为了减少匹配次数,可以删除待检测字段中重复的字段、语气词、助词等。进一步地,假设预设字典中存在一个参考字段为“XXA”,那么就可以得到该互动型短信对应的服务提供方的名称为“XXA”。需要说明的是,预设字典相当于一个数据库,用于存储现有的服务提供方的名称。具体地,预设字典可以是终端的本地存储器中存储的一个离线数据库,该离线数据库中存储有服务提供方的名称。预设字典也可以是云端数据库,当终端处于网络互联状态时,可以从云端数据库中获取服务提供方的名称。
S103、根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。
可选地,对预设周期内提取到的服务提供方的名称进行分类;
统计在预设周期内,所述用户收到每一类服务提供方发送的所述互动型短信的频率;
根据不同类别服务提供方的影响权重和频率,获取用户的稳定性评分;
根据所述稳定性评分,获得所述用户所属的类别。
本实施例中,服务提供方可以是:企业、网站、APP等;进一步地,可以根据服务提供方提供的服务类型对服务提供方进行分类。例如,可以分类四个大类,包括:金融支付类、社交娱乐类、购物类,以及其他服务类。以金融支付类为例,可以包括:支付宝、***、理财产品等等。一般情况而言,金融支付类绑定的手机号码的稳定性要大于社交娱乐类、购物类,以及其他服务类绑定的手机号码的稳定性。因此,可以对不同类别的服务提供方设置影响权重。
具体地,计算每个用户所有类别的服务提供方的方差,方差的含义如下:
式中:σ2为总体方差,X为变量(每一类别在预设周期的互动型短信数量),μ为总体均值(用户在统计周期内,预设周期时长收到的互动型短信的平均数量),N为总体例数(用户在统计周期内收到的互动型短信的总数量)。
针对每个类别下,分别计算短信数目的方差。
具体地,假设服务提供方被分为:金融支付类、社交娱乐类、购物类,以及其他服务类,每一类对应一个方差,但是其对于用户的影响是不一样的,因此,设置每一类对用户的影响权重,以10分为满分制的条件下,设定四类的影响程度分数分别为4、2.5、2、1.5。
进一步地,设定阈值A,阈值A的值可以根据实际业务进行调整。若总体方差σ2小于阈值A的,则分别计算四个类别的方差,每个类别的方差,乘以自己的影响度系数,最后除以10,获取一个权重调整过后的伪方差。伪方差的计算公式如下:
B=(σ1 2*4+σ2 2*2.5+σ3 2*2+σ4 2*1.5)/10
若B的值仍然小于阈值A,则认定用户为稳定用户。否则,按照四类服务提供方的方差大小进行排序,如果支付金融类和社交娱乐类的方差排名在前两名,则确定用户当前不是稳定型用户。本实施例中的稳定型用户是表示用户忠诚度基本持平,没有变化。
阈值大于A的,统计用户每个月平均收到的互动型短信数量的变化率。若互动型短信数量持续上升,则该用户为上升型,若持续下降,则该用户为下降型。
具体地,可以对金融支付类的方差较大,且每个月平均收到的互动型短信数量一直是下降的用户,进行重点标记维系。
用户类型为上升型和稳定型,说明用户使用此号码的意愿很稳定,而下降型则说明用户的使用意愿降低,尤其标注出金融支付类的通信号码变化率一直降低的话,很可能用户开始想要放弃此号码。
可选地,在步骤S103之后,本实施例中的方法还可以包括:
根据所述分类结果,向不同类别的用户推送不同的营销策略。
本实施例中,对于稳定型用户,根据用户的月度出账账单,推荐价值权益产品,如高稳定用户,推荐20元换购机场VIP通道+贵宾休息室一次等等。对于上升型用户,给用户推荐的是承诺最低消费,赠送短信中出现的通信主体的、有合作关系的APP的会员,如承诺低效99元,增赠送腾讯视频VIP会员三个月等等。对于下降型的用户,赠送流量和语音通话,并和合作银行,开展绑定银行卡,月度小额返话费等活动。
以上的各种策略,都会存储在一个整体的策略库中,用户分成三类,每类给出相应的用户user_id,user_id匹配策略,通过营销的平台触点(短信、微信、外呼等),直接推送给用户,并记录用户是否订购相应的策略产品,以备后期优化。
本实施例,通过获取互动型短信;从所述互动型短信中提取出服务提供方的名称;根据预设周期内用户与不同类别服务提供方的互动频率变化情况,对用户进行分类,得到分类结果。实现了对用户需求的精准分析,从而便于提供针对性的营销策略,提高营销效果。
图3为图2实施例中步骤S102的方法流程图,如图3所示,本实施例中的方法可以包括:
S1021、判断所述互动型短信是否为格式化短信;若是,则执行步骤S1022;若否,则执行步骤S1023。
S1022、直接从所述互动型短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称。
S1023、按照词性将所述互动型短信划分为若干个待检测字段。
本实施例中步骤S1021~步骤S1023的具体实现过程和原理请参考图2所示步骤S102中的相关描述,此处不再赘述。
S1024、若所述预设字典中不存在与所述待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中。
本实施例中,由于预设字典中的服务提供方的名称存在不完备的情况,因此存在预设字典中无法找到与所述待测字段匹配的参考字段,此时将所述待检测字段对应的分词词组加添至预设集合中。在该预设集合中,以分词词组为元素。例如,进行分词处理之后得到10个待检测字段“XXA/企业/给/您/发送/的/验证码/验证码/为/8888”,则将该10个待检测字段作为一个分词词组保存在预设集合中。
S1025、获取预设周期内所述预设集合中所有分词词组之间的相似度。
本实施例中,假设预设周期为1个月,在1个月内,所述预设集合中包含有M个分词词组,则分别计算M个分词词组两两之间的相似度。
具体地,假设M个分词词组中包含最多待检测字段的数量为P个,那么针对M个分词词组,分别构建一个P维向量。假设互动型短信A的分词词组为:百度/外卖/您/的/验证码/为/4678;互动型短信B的分词词组为:百度/地图/您/的/验证码/为/5311;P的值为10。为了计算互动型短信A和互动型短信B之间的相似度,分别构建向量A和向量B,其中A={1,1,1,1,1,1,1,0,0,0},B={1,0,1,1,1,1,0,0,0,0};向量中1表示两个向量在同一位置处出现了相同的待检测字段,向量中0表示两个向量在同一位置出现的待检测字段不同。计算向量A和向量B之间的余弦夹角的值,根据余弦夹角的值的大小来表征向量A和向量B之间的相似度。
S1026、将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数。
本实施例中,假设互动型短信A和互动型短信B的相似度大于80%,互动型短信A和互动型短信C的相似度也大于80%,则将互动型短信A、互动型短信B、互动型短信C作为一个子集。类似的,可以将预设集合中的分词词组划分为K个子集。
S1027、分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段。
本实施例中,假设第i个子集中筛选出重复度最高的待检测字段为“YYC”,i的取值范围为大于1且小于等于K。将待检测字段“YYC”作为候选字段。
S1028、对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。
本实施例中,为了确保预设字典中参考字段的准确性,还可以通过人工审核的方式对筛选出的候选参考字段进行审核。例如,候选参考字段为:百度提问、中国平安、平安保险、百度云等等。经过人工审核方式可以规范服务提供方的名称,或者将属于同一企业的候选参考字段进行整合。例如:“中国平安、平安保险”等同于一个企业,因此可以整合为一个参考字段“中国平安”。最后,将审核通过的候选参考字段添加至预设字典中。
本实施例,若预设字典中不存在与非格式化短信的待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中;获取预设周期内所述预设集合中所有分词词组之间的相似度;将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数;分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段;对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。从而实现了对非格式化的互动型短信的服务提供方的名称的提取,以及对预设字典中参考字段的及时更新。
图4为本发明实施例二提供的用户分析装置的结构示意图,如图4所示,本实施例中的装置可以包括:
获取模块10,用于获取互动型短信;
提取模块20,用于从所述互动型短信中提取出服务提供方的名称;
分析模块30,用于根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。
可选地,所述获取模块10,具体用于:
获取用户在预设周期内的所有短信记录;
从所述短信记录中筛选出包含验证码的短信作为互动型短信。
可选地,所述提取模块20,具体用于:
判断所述互动型短信是否为格式化短信;其中,格式化短信是指短信文本的首字符串中包含有预设标注符号;
若所述互动型短信为格式化短信,则直接从所述格式化短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称;
若所述互动型短信为非格式化短信,则对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称。
可选地,所述提取模块20,具体用于:
按照词性将所述非格式化短信划分为N个待检测字段,N为大于0的自然数;
将所述待检测字段与预设字典中的参考字段进行匹配,得到与所述参考字段匹配的目标字段,将所述目标字段作为所述非格式化短信对应的服务提供方的名称。
可选地,分析模块30,具体用于:
对预设周期内提取到的服务提供方的名称进行分类;
统计在预设周期内,所述用户收到每一类服务提供方发送的所述互动型短信的频率;
根据不同类别服务提供方的影响权重和频率,获取用户的稳定性评分;
根据所述稳定性评分,获得所述用户所属的类别。
本实施例可以执行上述图2、图3所示的方法中的技术方案,其实现过程和技术效果与上述方法类似,此处不再赘述。
图5为本发明实施例三提供的用户分析装置的结构示意图,如图5所示,本实施例中的装置在图4所示装置的基础上,还可以包括:
营销模块40,用于根据各用户所属的类别,向不同类别的用户推送不同的营销策略。
处理模块50,用于在按照词性将所述非格式化短信划分为若干个待检测字段之后,若所述预设字典中不存在与所述待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中;
获取预设周期内所述预设集合中所有分词词组之间的相似度;
将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数;
分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段;
对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。
本实施例可以执行上述图2、图3所示的方法中的技术方案,其实现过程和技术效果与上述方法类似,此处不再赘述。
图6为本发明实施例四提供的终端的结构示意图,如图6所示,本实施例中的终端60包括:处理器61和存储器62;
存储器62,用于存储计算机程序(如实现上述用户分析方法的应用程序、功能模块等)、计算机指令等,上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器62中。并且上述的计算机程序、计算机指令、数据等可以被处理器61调用。
处理器61,用于执行所述存储器62存储的所述计算机程序,以实现上述实施例涉及的方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。其中,存储器62、处理器61可以通过总线63耦合连接。
本实施例可以执行上述图2、图3所示的方法中的技术方案,其实现过程和技术效果与上述方法类似,此处不再赘述。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。
其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (15)
1.一种用户分析方法,其特征在于,包括:
获取互动型短信;
从所述互动型短信中提取出服务提供方的名称;
根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。
2.根据权利要求1所述的方法,其特征在于,所述获取互动型短信,包括:
获取用户在预设周期内的所有短信记录;
从所述短信记录中筛选出包含验证码的短信作为互动型短信。
3.根据权利要求1所述的方法,其特征在于,所述从所述互动型短信中提取出服务提供方的名称,包括:
判断所述互动型短信是否为格式化短信;其中,格式化短信是指短信文本的首字符串中包含有预设标注符号;
若所述互动型短信为格式化短信,则直接从所述格式化短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称;
若所述互动型短信为非格式化短信,则对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称。
4.根据权利要求3所述的方法,其特征在于,所述对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称,包括:
按照词性将所述非格式化短信划分为N个待检测字段,N为大于0的自然数;
将所述待检测字段与预设字典中的参考字段进行匹配,得到与所述参考字段匹配的目标字段,将所述目标字段作为所述非格式化短信对应的服务提供方的名称。
5.根据权利要求4所述的方法,其特征在于,在按照词性将所述非格式化短信划分为若干个待检测字段之后,还包括:
若所述预设字典中不存在与所述待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中;
获取预设周期内所述预设集合中所有分词词组之间的相似度;
将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数;
分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段;
对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。
6.根据权利要求1所述的方法,其特征在于,所述根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别,包括:
对预设周期内提取到的服务提供方的名称进行分类;
统计在预设周期内,所述用户收到每一类服务提供方发送的所述互动型短信的频率;
根据不同类别服务提供方的影响权重和频率,获取用户的稳定性评分;
根据所述稳定性评分,获得所述用户所属的类别。
7.根据权利要求1-6中任一项所述的方法,其特征在于,还包括:
根据各用户所属的类别,向不同类别的用户推送不同的营销策略。
8.一种用户分析装置,其特征在于,包括:
获取模块,用于获取互动型短信;
提取模块,用于从所述互动型短信中提取出服务提供方的名称;
分析模块,用于根据预设周期内用户与不同类别服务提供方的互动频率变化情况,分析获得所述用户所属的类别。
9.根据权利要求8所述的装置,其特征在于,所述获取模块,具体用于:
获取用户在预设周期内的所有短信记录;
从所述短信记录中筛选出包含验证码的短信作为互动型短信。
10.根据权利要求8所述的装置,其特征在于,所述提取模块,具体用于:
判断所述互动型短信是否为格式化短信;其中,格式化短信是指短信文本的首字符串中包含有预设标注符号;
若所述互动型短信为格式化短信,则直接从所述格式化短信的预设标注符号中提取出文本信息,将所述文本信息作为服务提供方的名称;
若所述互动型短信为非格式化短信,则对所述非格式化短信进行分词处理,并从分词处理的结果中提取出服务提供方的名称。
11.根据权利要求10所述的装置,其特征在于,所述提取模块,具体用于:
按照词性将所述非格式化短信划分为N个待检测字段,N为大于0的自然数;
将所述待检测字段与预设字典中的参考字段进行匹配,得到与所述参考字段匹配的目标字段,将所述目标字段作为所述非格式化短信对应的服务提供方的名称。
12.根据权利要求11所述的装置,其特征在于,还包括:
处理模块,用于在按照词性将所述非格式化短信划分为若干个待检测字段之后,若所述预设字典中不存在与所述待检测字段匹配的参考字段,则将所述待检测字段对应的分词词组添加至预设集合中;
获取预设周期内所述预设集合中所有分词词组之间的相似度;
将相似度大于预设阈值的分词词组划分为一个子集,得到K个子集,K为大于0的自然数;
分别从K个子集中筛选出重复度最高的待检测字段作为候选参考字段;
对所述候选参考字段进行审核,并将审核通过的所述候选参考字段添加至预设字典中。
13.根据权利要求8所述的装置,其特征在于,分析模块,具体用于:
对预设周期内提取到的服务提供方的名称进行分类;
统计在预设周期内,所述用户收到每一类服务提供方发送的所述互动型短信的频率;
根据不同类别服务提供方的影响权重和频率,获取用户的稳定性评分;
根据所述稳定性评分,获得所述用户所属的类别。
14.根据权利要求8-13中任一项所述的装置,其特征在于,还包括:
营销模块,用于根据各用户所属的类别,向不同类别的用户推送不同的营销策略。
15.一种终端,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810459561.6A CN108711073B (zh) | 2018-05-15 | 2018-05-15 | 用户分析方法、装置及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810459561.6A CN108711073B (zh) | 2018-05-15 | 2018-05-15 | 用户分析方法、装置及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108711073A true CN108711073A (zh) | 2018-10-26 |
CN108711073B CN108711073B (zh) | 2022-02-11 |
Family
ID=63868894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810459561.6A Active CN108711073B (zh) | 2018-05-15 | 2018-05-15 | 用户分析方法、装置及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108711073B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114143571A (zh) * | 2019-03-19 | 2022-03-04 | 广州虎牙信息科技有限公司 | 一种用户处理方法、装置、设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251853A (zh) * | 2008-02-20 | 2008-08-27 | 魔极科技(北京)有限公司 | 基于用户交互记录来挖掘用户属性的方法及*** |
US20090144306A1 (en) * | 2006-08-07 | 2009-06-04 | Huawei Technologies Co., Ltd. | System and method for generating communication subscriber description information |
CN101620717A (zh) * | 2009-07-22 | 2010-01-06 | 中兴通讯股份有限公司 | 一种用户需求的分析方法及*** |
US20100241599A1 (en) * | 2007-12-03 | 2010-09-23 | Huawei Technologies Co., Ltd. | Method for classifying users, method and device for collecting and analyzing behaviors |
CN106296389A (zh) * | 2016-07-28 | 2017-01-04 | 联动优势科技有限公司 | 一种用户信用度的评估方法及装置 |
-
2018
- 2018-05-15 CN CN201810459561.6A patent/CN108711073B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090144306A1 (en) * | 2006-08-07 | 2009-06-04 | Huawei Technologies Co., Ltd. | System and method for generating communication subscriber description information |
US20100241599A1 (en) * | 2007-12-03 | 2010-09-23 | Huawei Technologies Co., Ltd. | Method for classifying users, method and device for collecting and analyzing behaviors |
CN101251853A (zh) * | 2008-02-20 | 2008-08-27 | 魔极科技(北京)有限公司 | 基于用户交互记录来挖掘用户属性的方法及*** |
CN101620717A (zh) * | 2009-07-22 | 2010-01-06 | 中兴通讯股份有限公司 | 一种用户需求的分析方法及*** |
CN106296389A (zh) * | 2016-07-28 | 2017-01-04 | 联动优势科技有限公司 | 一种用户信用度的评估方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114143571A (zh) * | 2019-03-19 | 2022-03-04 | 广州虎牙信息科技有限公司 | 一种用户处理方法、装置、设备和存储介质 |
CN114143571B (zh) * | 2019-03-19 | 2024-01-19 | 广州虎牙信息科技有限公司 | 一种用户处理方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108711073B (zh) | 2022-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pournarakis et al. | A computational model for mining consumer perceptions in social media | |
CN107146089B (zh) | 一种刷单识别方法及装置,电子设备 | |
CN107248082B (zh) | 养卡识别方法及装置 | |
CN114119137B (zh) | 风险控制方法和装置 | |
CN105490823B (zh) | 一种数据处理方法及装置 | |
CN108153824B (zh) | 目标用户群体的确定方法及装置 | |
CN105787025B (zh) | 网络平台公共账号分类方法及装置 | |
CN105744005A (zh) | 客户定位分析方法及服务器 | |
CN108170759A (zh) | 投诉案件处理的方法、装置、计算机设备及存储介质 | |
CN108334489A (zh) | 文本核心词识别方法和装置 | |
CN111222976A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN106991577A (zh) | 一种确定目标用户的方法及装置 | |
CN106980667B (zh) | 一种给文章标注标签的方法和装置 | |
CN113093958A (zh) | 数据处理方法、装置和服务器 | |
CN108416684A (zh) | 一种账号主体的可信程度评估方法、装置及服务器 | |
CN108076032B (zh) | 一种异常行为用户识别方法及装置 | |
CN108170691A (zh) | 关联文书的确定方法和装置 | |
CN105359172A (zh) | 计算企业存在拖欠的概率 | |
CN109902129B (zh) | 基于大数据分析的保险代理人归类方法及相关设备 | |
CN109919667B (zh) | 一种用于识别企业ip的方法和装置 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN107807917A (zh) | 文本内容提取方法、装置、***及存储介质 | |
CN104751234B (zh) | 一种用户资产的预测方法及装置 | |
CN108711073A (zh) | 用户分析方法、装置及终端 | |
CN110210884A (zh) | 确定用户特征数据的方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |