CN111209487B - 用户数据分析方法、服务器及计算机可读存储介质 - Google Patents

用户数据分析方法、服务器及计算机可读存储介质 Download PDF

Info

Publication number
CN111209487B
CN111209487B CN202010008906.3A CN202010008906A CN111209487B CN 111209487 B CN111209487 B CN 111209487B CN 202010008906 A CN202010008906 A CN 202010008906A CN 111209487 B CN111209487 B CN 111209487B
Authority
CN
China
Prior art keywords
consumption
user
community
score
place
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010008906.3A
Other languages
English (en)
Other versions
CN111209487A (zh
Inventor
喻宁
史良洵
陈克炎
朱园丽
朱艳乔
陈皓云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd, Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010008906.3A priority Critical patent/CN111209487B/zh
Publication of CN111209487A publication Critical patent/CN111209487A/zh
Application granted granted Critical
Publication of CN111209487B publication Critical patent/CN111209487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种数据分析技术,揭露了一种用户数据分析方法,该方法包括:采集用户在预设时间段内的LBS轨迹数据;获取预设范围内的POI数据;将用户的LBS轨迹数据和POI数据进行匹配,分析出所述用户出现的消费场所;获取所述消费场所对应的消费信息;根据所述消费信息按预设规则为每个消费场所进行等级评分;将同一评分的消费场所作为一个社团种子集合,根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类;根据每个用户所属社团的等级评分,为所述用户建立消费能力标签。本发明还提供一种服务器及计算机可读存储介质。本发明能够在无需获知用户的消费记录或消费行为数据等信息的情况下,有效判断用户的消费能力。

Description

用户数据分析方法、服务器及计算机可读存储介质
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户数据分析方法、服务器及计算机可读存储介质。
背景技术
目前,对于如何确定用户的富裕程度和消费能力,往往是通过对用户做问卷调查、查询银行窗口记录及***消费记录等方式实现。另外,还可以从网上消费行为数据等判断用户的消费能力。但是,对于无消费数据的企业,则无法判断其用户的消费能力。
因此,如何在无需消费记录或消费行为数据等信息的情况下判断用户的消费能力,已经成为一个亟待解决的技术问题。
发明内容
有鉴于此,本发明提出一种用户数据分析方法、服务器及计算机可读存储介质,以解决以上技术问题。
首先,为实现上述目的,本发明提出一种用户数据分析方法,该方法包括步骤:
采集用户在预设时间段内的LBS轨迹数据;
获取预设范围内的POI数据;
将用户的所述LBS轨迹数据和所述POI数据进行匹配,分析出所述用户出现的消费场所;
获取所述消费场所对应的消费信息;
根据所述消费信息按预设规则为每个消费场所进行等级评分;
将同一评分的消费场所作为一个社团种子集合,根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类;及
根据每个用户所属社团的等级评分,为所述用户建立消费能力标签。
可选地,所述消费信息包括场所类型和消费水平,在所述获取所述消费场所对应的消费信息的步骤中,从所述POI数据和大众点评数据获取各个所述消费场所的所述消费信息。
可选地,所述根据所述消费信息按预设规则为每个消费场所进行等级评分的步骤包括:
预先设置各个评分项目的权重;
根据预设规则为每个消费场所的每个评分项目进行打分;
根据每个评分项目的分数和权重计算出所述消费场所的总分;
根据所述总分和预先设置的每个等级对应的分数区间,得到所述场所的等级评分。
可选地,所述根据所述消费信息按预设规则为每个消费场所进行等级评分的步骤还包括:
利用逻辑回归模型为每个消费场所进行等级评分,模型输出的数据为所述消费场所的等级评分结果。
可选地,所述根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类的步骤包括:
根据每个用户对应的消费场所的等级评分,以及所述用户在每个消费场所出现的频次和驻留时长,利用所述CNM社团发现模型将所有用户分别归类到其中一个社团内。
可选地,在所述根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类的步骤中,将每个用户归类到出现频次最多、驻留时长最长的社团中,其中,在所述CNM社团发现模型中,所述出现频次和驻留时长的权重各为50%。
可选地,所述根据每个用户所属社团的等级评分,为所述用户建立消费能力标签的步骤包括:
在将每个用户分别归类到一个社团后,将每个社团对应的消费场所的等级评分作为所述社团中每个用户的消费能力等级评分,为用户建立与所述消费能力等级评分对应的消费能力标签。
可选地,在得到每个用户的消费能力等级评分后,所述方法还包括:
针对每个用户,综合多个时间段的消费能力等级评分结果,得到综合等级评分,为用户建立与所述综合消费能力等级评分对应的消费能力标签。
此外,为实现上述目的,本发明还提供一种服务器,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的用户数据分析***,所述用户数据分析***被所述处理器执行时实现如上述的用户数据分析方法的步骤。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有用户数据分析***,所述用户数据分析***可被至少一个处理器执行,以使所述至少一个处理器执行如上述的用户数据分析方法的步骤。
相较于现有技术,本发明所提出的用户数据分析方法、服务器及计算机可读存储介质,可以通过用户的LBS轨迹数据和POI数据分析出用户出现的消费场所,然后根据消费场所的消费信息进行评分,并根据用户在每个消费场所出现的频次和驻留时长,利用CNM社团发现模型将用户进行分类,从而判断出用户的消费能力。本发明无需获知用户的消费记录或消费行为数据等信息即可分析得到用户的消费能力,为行业中有LBS轨迹数据但没有用户消费数据(消费记录或消费行为数据)的企业提供了一种有效判断用户消费能力的方案。
附图说明
图1是本发明服务器一可选的硬件架构的示意图;
图2是本发明用户数据分析***第一实施例的程序模块示意图;
图3是本发明用户数据分析***第二实施例的程序模块示意图;
图4是本发明用户数据分析方法第一实施例的流程示意图;
图5是本发明用户数据分析方法第二实施例的流程示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明服务器2一可选的硬件架构的示意图。
本实施例中,所述服务器2可包括,但不仅限于,可通过***总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是,图1仅示出了具有组件11-13的服务器2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,所述服务器2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该服务器2可以是独立的服务器,也可以是多个服务器所组成的服务器集群。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述服务器2的内部存储单元,例如该服务器2的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述服务器2的外部存储设备,例如该服务器2上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述服务器2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述服务器2的操作***和各类应用软件,例如用户数据分析***200的程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述服务器2的总体操作。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行所述的用户数据分析***200等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述服务器2与其他电子设备之间建立通信连接。
至此,己经详细介绍了本发明相关设备的硬件结构和功能。下面,将基于上述介绍提出本发明的各个实施例。
首先,本发明提出一种用户数据分析***200。
参阅图2所示,是本发明用户数据分析***200第一实施例的程序模块图。
本实施例中,所述用户数据分析***200包括一系列的存储于存储器11上的计算机程序指令,当该计算机程序指令被处理器12执行时,可以实现本发明各实施例的用户数据分析操作。在一些实施例中,基于该计算机程序指令各部分所实现的特定的操作,用户数据分析***200可以被划分为一个或多个模块。例如,在图2中,所述用户数据分析***200可以被分割成采集模块201、获取模块202、匹配模块203、评分模块204、分类模块205、建立模块206。其中:
所述采集模块201,用于采集用户在预设时间段内的LBS轨迹数据。
具体地,基于位置的服务(Location Based Services,LBS)是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。其由用户对应的移动终端使用无线通信网络(或卫星定位***),基于空间数据库,获取用户的地理位置坐标信息并与其他信息集成以向用户提供所需的与位置相关的增值服务。目前,LBS常用的定位技术包括:全球定位***、WiFi定位、IP地址定位、三角测量法等。LBS的主要特点包括:覆盖范围广、定位精度高、操作简便。
所述LBS轨迹数据具体包含的信息为用户对应的设备(一般为移动终端)在某个时间点出现在某个地点(经纬度),即包括时间和位置(经纬度)信息。
所述预设时间段可以是一周、一个月等。在所述预设时间段内,采集每个用户的所有LBS轨迹数据。
所述获取模块202,用于获取预设范围内的兴趣点(Point of Interest,POI)数据。
具体地,在地理信息***中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。每个POI包含名称、类别、坐标等信息,其中,每个分类都有相应的行业的代码和名称对应。简单来说,所述POI数据可以显示每个位置(经纬度)对应什么场所。一般情况下,所述POI数据包括兴趣点位置信息、兴趣点类别和兴趣点图片等。
所述预设范围可以是该用户所在的地区或者该用户的所述LBS轨迹数据所涵盖的地理范围。
所述匹配模块203,用于将用户的LBS轨迹数据和所述POI数据进行匹配,分析出用户出现的消费场所。
具体地,根据所述POI数据可以知道哪些位置属于消费场所,再将该用户的LBS轨迹数据和所述POI数据进行匹配,可以分析出所述LBS轨迹数据对应的消费场所,即该用户出现在哪些消费场所。
在本实施例中,可以对应记录该用户的(移动终端)设备号、时间(进出每个消费场所的时间)、出现的消费场所等。例如:用户A/设备号001:周一18:05-19:32,餐厅B;周二07:20-07:25,便利店C;周六10:30-11:50,商场D;周六11:56-12:47,餐厅E;周日15:19-16:24,宠物医院F。
所述获取模块202,还用于获取所述消费场所对应的消费信息。
具体地,所述消费信息可以包括场所类型(例如商场、便利店、酒店、餐厅、医院、宠物医院等)和消费水平(例如人均消费金额)等。在本实施例中,可以从所述POI数据和大众点评数据等数据源获取各个消费场所的所述消费信息。
所述评分模块204,用于根据所述消费信息按预设规则为每个消费场所进行等级评分。
具体地,预先设置各个评分项目(例如所述消费信息中的场所类型和消费水平)的权重,并根据预设规则为每个消费场所的每个评分项目进行打分,然后根据每个评分项目的分数和权重计算出该场所的总分。最后,根据该总分和预先设置的每个等级对应的分数区间,为该场所评级。
或者,可以利用逻辑回归(Logistic regression)模型为每个消费场所进行等级评分,模型输出的数据即为各消费场所的等级评分结果。
在本实施例中,可以按上述方式将各消费场所的等级评分分为0-10。
例如,便利店C的等级评分为2,餐厅B和餐厅E的等级评分均为5,商场C的等级评分为6,宠物医院F的等级评分为7。
所述分类模块205,用于将同一评分的消费场所作为一个社团种子集合,根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类。
具体地,在CNM社团发现模型中,将同一评分的消费场所作为一个社团种子集合(例如等级评分为5的餐厅B和餐厅E属于同一个社团),然后根据每个用户对应的消费场所的等级评分,利用该CNM社团发现模型将所有用户都归类到某个社团内。其中,社团边的权重计算方式是:出现在该社团(消费场所集合)的频次和驻留时长(权重各50%)。值得注意的是,通过该CNM社团发现模型,所有用户都会归类到其中一个社团内,且每个用户只能归类到其中一个社团。
也就是说,根据上述处理过程,可以得到每个用户出入的多个消费场所,以及在每个消费场所出现的频次和驻留时长,然后通过该CNM社团发现模型,根据每个用户出现在各消费场所的频次和驻留时长对该用户进行归类,最后每个用户会归类到出现频次最多、驻留时长最长的社团中。
例如,上述便利店C属于第二社团(等级评分为2),餐厅B和餐厅E属于第五社团(等级评分为5),商场C属于第六社团(等级评分为6),宠物医院F属于第七社团(等级评分为7),从出现频次和驻留时长来看,用户A去第五社团对应的消费场所次数最多/时长最久,所以用户A归类到第五社团。
所述建立模块206,用于根据每个用户所属社团的等级评分,为该用户建立消费能力标签。
具体地,在将每个用户归类到其中一个社团后,将每个社团对应的消费场所的等级评分作为该社团中每个用户的消费能力等级评分,为所有用户建立相应消费能力标签。例如,将第五社团的等级评分5作为用户A的消费能力标签,即用户A的消费能力等级评分为5。
本实施例提供的用户数据分析***,可以通过用户的LBS轨迹数据和POI数据分析出用户出现的消费场所,然后根据消费场所的消费信息进行评分,并根据用户在每个消费场所出现的频次和驻留时长,利用CNM社团发现模型将用户进行分类,从而判断出用户的消费能力。本实施例无需获知用户的消费记录或消费行为数据等信息即可分析得到用户的消费能力,为行业中有LBS轨迹数据但没有用户消费数据(消费记录或消费行为数据)的企业提供了一种有效判断用户消费能力的方案。
参阅图3所示,是本发明用户数据分析***200第二实施例的程序模块图。本实施例中,所述的用户数据分析***200除了包括第一实施例中的所述采集模块201、获取模块202、匹配模块203、评分模块204、分类模块205、建立模块206之外,还包括综合模块207。
所述综合模块207,用于针对每个用户,综合多个时间段的等级评分结果,得到综合等级评分,作为该用户的消费能力标签。
具体地,可以采集该用户多个时间段内的LBS轨迹数据(例如所述预设时间段为一周,则采集一个月/四周的数据,即得到四组LBS轨迹数据),根据每个时间段的数据均可按上述过程得到该用户的消费能力等级评分(即得到四个等级评分),再综合各时间段对应的等级评分求平均值,得到最后的综合等级评分,作为该用户的消费能力标签。
本实施例提供的用户数据分析***,可以将根据多个时间段内的LBS轨迹数据分析得到的用户的多个消费能力等级评分进行综合,更加准确地判断出用户的消费能力。
此外,本发明还提出一种用户数据分析方法。
参阅图4所示,是本发明用户数据分析方法第一实施例的流程示意图。在本实施例中,根据不同的需求,图4所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
该方法包括以下步骤:
步骤S400,采集用户在预设时间段内的LBS轨迹数据。
具体地,LBS是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。其由用户对应的移动终端使用无线通信网络(或卫星定位***),基于空间数据库,获取用户的地理位置坐标信息并与其他信息集成以向用户提供所需的与位置相关的增值服务。目前,LBS常用的定位技术包括:全球定位***、WiFi定位、IP地址定位、三角测量法等。LBS的主要特点包括:覆盖范围广、定位精度高、操作简便。
所述LBS轨迹数据具体包含的信息为用户对应的设备(一般为移动终端)在某个时间点出现在某个地点(经纬度),即包括时间和位置(经纬度)信息。
所述预设时间段可以是一周、一个月等。在所述预设时间段内,采集每个用户的所有LBS轨迹数据。
步骤S402,获取预设范围内的POI数据。
具体地,在地理信息***中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。每个POI包含名称、类别、坐标等信息,其中,每个分类都有相应的行业的代码和名称对应。简单来说,所述POI数据可以显示每个位置(经纬度)对应什么场所。一般情况下,所述POI数据包括兴趣点位置信息、兴趣点类别和兴趣点图片等。
所述预设范围可以是该用户所在的地区或者该用户的所述LBS轨迹数据所涵盖的地理范围。
步骤S404,将用户的LBS轨迹数据和所述POI数据进行匹配,分析出用户出现的消费场所。
具体地,根据所述POI数据可以知道哪些位置属于消费场所,再将该用户的LBS轨迹数据和所述POI数据进行匹配,可以分析出所述LBS轨迹数据对应的消费场所,即该用户出现在哪些消费场所。
在本实施例中,可以对应记录该用户的(移动终端)设备号、时间(进出每个消费场所的时间)、出现的消费场所等。例如:用户A/设备号001:周一18:05-19:32,餐厅B;周二07:20-07:25,便利店C;周六10:30-11:50,商场D;周六11:56-12:47,餐厅E;周日15:19-16:24,宠物医院F。
步骤S406,获取所述消费场所对应的消费信息。
具体地,所述消费信息可以包括场所类型(例如商场、便利店、酒店、餐厅、医院、宠物医院等)和消费水平(例如人均消费金额)等。在本实施例中,可以从所述POI数据和大众点评数据等数据源获取各个消费场所的所述消费信息。
步骤S408,根据所述消费信息按预设规则为每个消费场所进行等级评分。
具体地,预先设置各个评分项目(例如所述消费信息中的场所类型和消费水平)的权重,并根据预设规则为每个消费场所的每个评分项目进行打分,然后根据每个评分项目的分数和权重计算出该场所的总分。最后,根据该总分和预先设置的每个等级对应的分数区间,为该场所评级。
或者,可以利用逻辑回归(Logistic regression)模型为每个消费场所进行等级评分,模型输出的数据即为各消费场所的等级评分结果。
在本实施例中,可以按上述方式将各消费场所的等级评分分为0-10。
例如,便利店C的等级评分为2,餐厅B和餐厅E的等级评分均为5,商场C的等级评分为6,宠物医院F的等级评分为7。
步骤S410,将同一评分的消费场所作为一个社团种子集合,根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类。
具体地,在CNM社团发现模型中,将同一评分的消费场所作为一个社团种子集合(例如等级评分为5的餐厅B和餐厅E属于同一个社团),然后根据每个用户对应的消费场所的等级评分,利用该CNM社团发现模型将所有用户都归类到某个社团内。其中,社团边的权重计算方式是:出现在该社团(消费场所集合)的频次和驻留时长(权重各50%)。值得注意的是,通过该CNM社团发现模型,所有用户都会归类到其中一个社团内,且每个用户只能归类到其中一个社团。
也就是说,根据上述步骤S400-S404,可以得到每个用户出入的多个消费场所,以及在每个消费场所出现的频次和驻留时长,然后通过该CNM社团发现模型,根据每个用户出现在各消费场所的频次和驻留时长对该用户进行归类,最后每个用户会归类到出现频次最多、驻留时长最长的社团中。
例如,上述便利店C属于第二社团(等级评分为2),餐厅B和餐厅E属于第五社团(等级评分为5),商场C属于第六社团(等级评分为6),宠物医院F属于第七社团(等级评分为7),从出现频次和驻留时长来看,用户A去第五社团对应的消费场所次数最多/时长最久,所以用户A归类到第五社团。
步骤S412,根据每个用户所属社团的等级评分,为该用户建立消费能力标签。
具体地,在将每个用户归类到其中一个社团后,将每个社团对应的消费场所的等级评分作为该社团中每个用户的消费能力等级评分,为所有用户建立相应消费能力标签。例如,将第五社团的等级评分5作为用户A的消费能力标签,即用户A的消费能力等级评分为5。
本实施例提供的用户数据分析方法,可以通过用户的LBS轨迹数据和POI数据分析出用户出现的消费场所,然后根据消费场所的消费信息进行评分,并根据用户在每个消费场所出现的频次和驻留时长,利用CNM社团发现模型将用户进行分类,从而判断出用户的消费能力。本实施例无需获知用户的消费记录或消费行为数据等信息即可分析得到用户的消费能力,为行业中有LBS轨迹数据但没有用户消费数据(消费记录或消费行为数据)的企业提供了一种有效判断用户消费能力的方案。
如图5所示,是本发明用户数据分析方法的第二实施例的流程示意图。本实施例中,所述用户数据分析方法的步骤S500-S510与第一实施例的步骤S400-S410相类似,区别在于该方法还包括步骤S512-S514。
该方法包括以下步骤:
步骤S500,采集用户在预设时间段内的LBS轨迹数据。
具体地,LBS是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。其由用户对应的移动终端使用无线通信网络(或卫星定位***),基于空间数据库,获取用户的地理位置坐标信息并与其他信息集成以向用户提供所需的与位置相关的增值服务。目前,LBS常用的定位技术包括:全球定位***、WiFi定位、IP地址定位、三角测量法等。LBS的主要特点包括:覆盖范围广、定位精度高、操作简便。
所述LBS轨迹数据具体包含的信息为用户对应的设备(一般为移动终端)在某个时间点出现在某个地点(经纬度),即包括时间和位置(经纬度)信息。
所述预设时间段可以是一周、一个月等。在所述预设时间段内,采集每个用户的所有LBS轨迹数据。
步骤S502,获取预设范围内的POI数据。
具体地,在地理信息***中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。每个POI包含名称、类别、坐标等信息,其中,每个分类都有相应的行业的代码和名称对应。简单来说,所述POI数据可以显示每个位置(经纬度)对应什么场所。一般情况下,所述POI数据包括兴趣点位置信息、兴趣点类别和兴趣点图片等。
所述预设范围可以是该用户所在的地区或者该用户的所述LBS轨迹数据所涵盖的地理范围。
步骤S504,将用户的LBS轨迹数据和所述POI数据进行匹配,分析出用户出现的消费场所。
具体地,根据所述POI数据可以知道哪些位置属于消费场所,再将该用户的LBS轨迹数据和所述POI数据进行匹配,可以分析出所述LBS轨迹数据对应的消费场所,即该用户出现在哪些消费场所。
在本实施例中,可以对应记录该用户的(移动终端)设备号、时间(进出每个消费场所的时间)、出现的消费场所等。例如:用户A/设备号001:周一18:05-19:32,餐厅B;周二07:20-07:25,便利店C;周六10:30-11:50,商场D;周六11:56-12:47,餐厅E;周日15:19-16:24,宠物医院F。
步骤S506,获取所述消费场所对应的消费信息。
具体地,所述消费信息可以包括场所类型(例如商场、便利店、酒店、餐厅、医院、宠物医院等)和消费水平(例如人均消费金额)等。在本实施例中,可以从所述POI数据和大众点评数据等数据源获取各个消费场所的所述消费信息。
步骤S508,根据所述消费信息按预设规则为每个消费场所进行等级评分。
具体地,预先设置各个评分项目(例如所述消费信息中的场所类型和消费水平)的权重,并根据预设规则为每个消费场所的每个评分项目进行打分,然后根据每个评分项目的分数和权重计算出该场所的总分。最后,根据该总分和预先设置的每个等级对应的分数区间,为该场所评级。
或者,可以利用Logistic regression模型为每个消费场所进行等级评分,模型输出的数据即为各消费场所的等级评分结果。
在本实施例中,可以按上述方式将各消费场所的等级评分分为0-10。
例如,便利店C的等级评分为2,餐厅B和餐厅E的等级评分均为5,商场C的等级评分为6,宠物医院F的等级评分为7。
步骤S510,将同一评分的消费场所作为一个社团种子集合,根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类。
具体地,在CNM社团发现模型中,将同一评分的消费场所作为一个社团种子集合(例如等级评分为5的餐厅B和餐厅E属于同一个社团),然后根据每个用户对应的消费场所的等级评分,利用该CNM社团发现模型将所有用户都归类到某个社团内。其中,社团边的权重计算方式是:出现在该社团(消费场所集合)的频次和驻留时长(权重各50%)。值得注意的是,通过该CNM社团发现模型,所有用户都会归类到其中一个社团内,且每个用户只能归类到其中一个社团。
也就是说,根据上述步骤S500-S504,可以得到每个用户出入的多个消费场所,以及在每个消费场所出现的频次和驻留时长,然后通过该CNM社团发现模型,根据每个用户出现在各消费场所的频次和驻留时长对该用户进行归类,最后每个用户会归类到出现频次最多、驻留时长最长的社团中。
例如,上述便利店C属于第二社团(等级评分为2),餐厅B和餐厅E属于第五社团(等级评分为5),商场C属于第六社团(等级评分为6),宠物医院F属于第七社团(等级评分为7),从出现频次和驻留时长来看,用户A去第五社团对应的消费场所次数最多/时长最久,所以用户A归类到第五社团。
步骤S512,根据每个用户所属社团的等级评分,得到该用户的消费能力等级评分。
具体地,在将每个用户归类到其中一个社团后,将每个社团对应的消费场所的等级评分作为该社团中每个用户的消费能力等级评分,为所有用户建立相应消费能力标签。例如,将第五社团的等级评分5作为用户A的消费能力标签,即用户A的消费能力等级评分为5。
步骤S514,针对每个用户,综合多个时间段的等级评分结果,得到综合等级评分,作为该用户的消费能力标签。
具体地,可以采集该用户多个时间段内的LBS轨迹数据(例如所述预设时间段为一周,则采集一个月/四周的数据,即得到四组LBS轨迹数据),根据每个时间段的数据均可按上述步骤得到该用户的消费能力等级评分(即得到四个等级评分),再综合各时间段对应的等级评分求平均值,得到最后的综合等级评分,作为该用户的消费能力标签。
本实施例提供的用户数据分析方法,无需获知用户的消费记录或消费行为数据等信息即可分析得到用户的消费能力,并且可以将根据多个时间段内的LBS轨迹数据分析得到的用户的多个消费能力等级评分进行综合,更加准确地判断出用户的消费能力。
本发明还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有用户数据分析程序,所述用户数据分析程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的用户数据分析方法的步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (5)

1.一种用户数据分析方法,其特征在于,所述方法包括步骤:
采集用户在预设时间段内的基于位置的服务LBS轨迹数据;
获取预设范围内的兴趣点POI数据;
将用户的所述LBS轨迹数据和所述POI数据进行匹配,分析出所述用户出现的消费场所;
获取所述消费场所对应的消费信息;
根据所述消费信息按预设规则为每个消费场所进行等级评分;
将同一评分的消费场所作为一个社团种子集合,根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类;及
根据每个用户所属社团的等级评分,为所述用户建立消费能力标签;
所述消费信息包括场所类型和消费水平,所述场所类型包括商场、便利店、酒店、餐厅、医院及宠物医院中的一项或多项,所述消费水平包括人均消费金额,在所述获取所述消费场所对应的消费信息的步骤中,从所述POI数据和大众点评数据获取各个所述消费场所的所述消费信息;
所述根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类的步骤包括:
根据每个用户对应的消费场所的等级评分,以及所述用户在每个消费场所出现的频次和驻留时长,利用所述CNM社团发现模型将所有用户分别归类到其中一个社团内;
在所述根据每个用户对应的消费场所的等级评分,利用CNM社团发现模型将用户进行归类的步骤中,将每个用户归类到出现频次最多、驻留时长最长的社团中,其中,在所述CNM社团发现模型中,所述出现频次和驻留时长的权重各为50%;
所述根据每个用户所属社团的等级评分,为所述用户建立消费能力标签的步骤包括:
在将每个用户分别归类到一个社团后,将每个社团对应的消费场所的等级评分作为所述社团中每个用户的消费能力等级评分,为用户建立与所述消费能力等级评分对应的消费能力标签;
在得到每个用户的消费能力等级评分后,所述方法还包括:
针对每个用户,综合多个时间段的消费能力等级评分结果,得到综合消费能力等级评分,为用户建立与所述综合消费能力等级评分对应的消费能力标签。
2.如权利要求1所述的用户数据分析方法,其特征在于,所述根据所述消费信息按预设规则为每个消费场所进行等级评分的步骤包括:
预先设置各个评分项目的权重;
根据预设规则为每个消费场所的每个评分项目进行打分;
根据每个评分项目的分数和权重计算出所述消费场所的总分;
根据所述总分和预先设置的每个等级对应的分数区间,得到所述场所的等级评分。
3.如权利要求2所述的用户数据分析方法,其特征在于,所述根据所述消费信息按预设规则为每个消费场所进行等级评分的步骤还包括:
利用逻辑回归模型为每个消费场所进行等级评分,模型输出的数据为所述消费场所的等级评分结果。
4.一种服务器,其特征在于,所述服务器包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的用户数据分析***,所述用户数据分析***被所述处理器执行时实现如权利要求1-3中任一项所述的用户数据分析方法的步骤。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有用户数据分析***,所述用户数据分析***可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-3中任一项所述的用户数据分析方法的步骤。
CN202010008906.3A 2020-01-02 2020-01-02 用户数据分析方法、服务器及计算机可读存储介质 Active CN111209487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010008906.3A CN111209487B (zh) 2020-01-02 2020-01-02 用户数据分析方法、服务器及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010008906.3A CN111209487B (zh) 2020-01-02 2020-01-02 用户数据分析方法、服务器及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111209487A CN111209487A (zh) 2020-05-29
CN111209487B true CN111209487B (zh) 2020-10-27

Family

ID=70789718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010008906.3A Active CN111209487B (zh) 2020-01-02 2020-01-02 用户数据分析方法、服务器及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111209487B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113573245A (zh) * 2021-09-27 2021-10-29 广东邦盛北斗科技股份公司 一种商家消费供应信息发放方法、存储介质和发放***
CN114741612B (zh) * 2022-06-13 2022-09-02 北京融信数联科技有限公司 一种基于大数据的消费习惯分类方法、***和存储介质
CN116681507B (zh) * 2023-05-18 2024-07-09 北京大也智慧数据科技服务有限公司 偿贷指数计算方法、装置、存储介质及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798557A (zh) * 2017-09-30 2018-03-13 平安科技(深圳)有限公司 电子装置、基于lbs数据的服务场所推荐方法及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101163827B1 (ko) * 2009-05-15 2012-07-09 현대자동차주식회사 위치기반 데이터 서비스 장치 및 방법
CN106779789A (zh) * 2015-11-24 2017-05-31 亿阳信通股份有限公司 一种地理位置的商业价值分析***和方法
CN109635190B (zh) * 2018-11-28 2023-06-27 四川亨通网智科技有限公司 基于位置和行为联合分析的用户特征挖掘方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798557A (zh) * 2017-09-30 2018-03-13 平安科技(深圳)有限公司 电子装置、基于lbs数据的服务场所推荐方法及存储介质

Also Published As

Publication number Publication date
CN111209487A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN107798557B (zh) 电子装置、基于lbs数据的服务场所推荐方法及存储介质
CN111209487B (zh) 用户数据分析方法、服务器及计算机可读存储介质
CN108446281B (zh) 确定用户亲密度的方法、装置及存储介质
CN106709606B (zh) 个性化场景预测方法及装置
Ahas et al. Using mobile positioning data to model locations meaningful to users of mobile phones
US9536202B2 (en) Identifying geospatial patterns from device data
US9646318B2 (en) Updating point of interest data using georeferenced transaction data
CN109801091B (zh) 目标用户群体定位方法、装置、计算机设备和存储介质
CN110020221B (zh) 职住分布确认方法、装置、服务器及计算机可读存储介质
CN112398895B (zh) 提供服务信息的方法及装置
CN110008414B (zh) 地理信息点的确定方法和装置
JP2016525834A (ja) ネットワークアドレスへの属性の関連付け
US8554788B2 (en) Apparatus and method for analyzing information about floating population
CN104902438A (zh) 一种基于移动通信终端分析客流特征信息的统计方法及其***
JP2002342367A (ja) 情報配信システム及び情報配信方法
CN111132027B (zh) 一种场景识别网络图的绘制方法、场景识别方法及装置
CN111723959A (zh) 区域的划分方法、装置、存储介质及电子装置
CN112861972A (zh) 一种展业区域的选址方法、装置、计算机设备和介质
CN111954175A (zh) 一种兴趣点到访判别方法和相关装置
CN112653748A (zh) 信息推送的方法、装置、电子设备及可读存储介质
CN112819544A (zh) 基于大数据的广告投放方法、装置、设备及存储介质
CN112241489A (zh) 信息推送方法、装置、可读存储介质和计算机设备
CN111475746B (zh) 兴趣点位置挖掘方法、装置、计算机设备和存储介质
CN111339409A (zh) 地图展示方法与***
CN114547386A (zh) 基于Wi-Fi信号的定位方法、装置,以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant