CN112215658A - 基于大数据的选址方法、装置、计算机设备及存储介质 - Google Patents

基于大数据的选址方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112215658A
CN112215658A CN202011104776.XA CN202011104776A CN112215658A CN 112215658 A CN112215658 A CN 112215658A CN 202011104776 A CN202011104776 A CN 202011104776A CN 112215658 A CN112215658 A CN 112215658A
Authority
CN
China
Prior art keywords
user
users
big data
target
target customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011104776.XA
Other languages
English (en)
Inventor
巴豪
赵媛媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202011104776.XA priority Critical patent/CN112215658A/zh
Publication of CN112215658A publication Critical patent/CN112215658A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例属于大数据领域,应用于智慧社区领域中,涉及一种基于大数据的选址方法,包括获取待选址对象的定位信息和目标客户群,根据定位信息和目标客户群建立选址对象画像,从预设数据库中获取每个用户的基本特征和用户行为特征,根据基本特征和用户行为特征构建用户画像,然后根据用户画像之间的相似度,对所有用户进行分类,得到不同的用户类,基于选址对象画像和用户类确定备选地址。本申请还提供一种基于大数据的选址装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,用户的基本特征和用户行为特征可存储于区块链中。本申请在大数据的支持下,使得选址不再盲目,选址更加全面可靠,提高选址的准确性。

Description

基于大数据的选址方法、装置、计算机设备及存储介质
技术领域
本申请涉及大数据处理技术领域,尤其涉及基于大数据的选址方法、装置、计算机设备及存储介质。
背景技术
随着智慧城市的发展,消费者对于商家的需求主要是便利性,商家为了更好服务于消费者,关键在于如何为商铺进行选址,选址是影响商铺经营的一个重要决策。目前,商铺选址主要通过搜集和调研地段和客流量数据来选址,但这种选址方式往往费时又费力,且选址的结果不够全面、准确。
发明内容
本申请实施例的目的在于提出一种基于大数据的选址方法、装置、计算机设备及存储介质,以解决相关选址方式费时费力,效率较低且准确性不高的问题。
为了解决上述技术问题,本申请实施例提供一种基于大数据的选址方法,采用了如下所述的技术方案:
获取待选址对象的定位信息和目标客户群,根据所述定位信息和目标客户群建立选址对象画像;
从预设数据库中获取每个用户的基本特征和用户行为特征,根据所述基本特征和所述用户行为特征构建用户画像;
根据所述用户画像之间的相似度,对所有用户进行分类,得到不同的用户类;及
基于所述选址对象画像和所述用户类确定备选地址。
进一步的,所述根据所述定位信息和目标客户群建立选址对象画像的步骤包括:
对所述定位信息和所述目标客户群分别进行特征提取,得到对应的选址对象特征和目标客户特征;
根据所述选址对象特征和目标客户特征生成目标客户标签以及所述目标客户标签对应的权重;
根据所述目标客户标签以及所述目标客户标签对应的权重构建选址对象画像。
进一步的,所述根据所述选址对象特征和目标客户特征生成目标客户标签以及所述目标客户标签对应的权重的步骤包括:
基于所述选址对象特征和所述目标客户特征对目标客户群进行分类,并给不同类别的目标客户标定具有所述目标客户群特点的目标客户标签;
根据所述目标客户标签出现的频率或比重为所述目标客户标签赋予权重。
进一步的,所述根据所述基本特征和所述用户行为特征构建用户画像的步骤包括:
根据所述基本特征和所述用户行为特征生成用户标签以及用户标签对应的权重;
根据所述用户标签以及用户标签对应的权重构建所述用户画像。
进一步的,所述根据所述用户画像之间的相似度,对所有用户进行分类的步骤包括:
从所有用户中随机选取预设个数的第一用户,分别将第一用户设定为一个类簇的中心点;其中,预设个数为聚类出的类簇的个数;
将除所述第一用户之外的用户根据用户画像,分别聚类到与所述第一用户的用户画像相似度最接近的所述类簇中;
基于获取到的类簇中的每个用户的用户画像对中心点进行更新;
基于更新后的中心点对类簇中的用户重新进行聚类,直到更新出的类簇中,包括的用户与前一次聚类后类簇包括的用户相同则停止重新聚类,得到目标区域的所有类簇。
进一步的,所述基于所述选址对象画像和所述用户类确定备选地址的步骤包括:
计算所述选址对象画像与每类用户的用户画像之间的匹配度;
筛选出匹配度最高的预设数量的用户类,并根据所述用户类确定待选址对象的备选地址。
进一步的,所述计算所述选址对象画像与每类用户的用户画像之间的匹配度的步骤包括:
计算目标客户群与每个用户类之间的相似度;
将所述相似度确定为所述待选址对象与所述每类用户的匹配度。
为了解决上述技术问题,本申请实施例还提供一种基于大数据的选址装置,采用了如下所述的技术方案:
选址对象画像构建模块,用于获取待选址对象的定位信息和目标客户群,根据所述定位信息和目标客户群建立选址对象画像;
用户画像构建模块,用于从预设数据库中获取每个用户的基本特征和用户行为特征,根据所述基本特征和所述用户行为特征构建用户画像;
分类模块,用于根据所述用户画像之间的相似度,对所有用户进行分类,得到不同的用户类;及
选址模块,用于基于所述选址对象画像和所述用户类确定备选地址。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
该计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的基于大数据的选址方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的基于大数据的选址方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请通过获取待选址对象的定位信息和目标客户群,根据定位信息和目标客户群建立选址对象画像,从预设数据库中获取每个用户的基本特征和用户行为特征,根据基本特征和用户行为特征构建用户画像,然后根据用户画像之间的相似度,对所有用户进行分类,得到不同的用户类,基于选址对象画像和分类结果确定备选地址;本申请通过构建的选址对象画像和用户画像进行选址,在大数据的支持下,使得选址不再盲目,选址更加全面可靠,提高选址的准确性,进一步实现用户群体的精准定位。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性***架构图;
图2根据本申请的基于大数据的选址方法的一个实施例的流程图;
图3是图2中步骤S201的一种具体实施方式的流程图;
图4是图2中步骤S203的一种具体实施方式的流程图;
图5是图2中步骤S204的一种具体实施方式的流程图;
图6是根据本申请的基于大数据的选址装置的一个实施例的结构示意图;
图7是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
为了解决相关选址方式费时费力,效率较低且准确性不高的问题,本申请提供了一种基于大数据的选址方法,可以应用于如图1所示的***架构100中,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于大数据的选址方法一般由服务器或终端设备执行,相应地,基于大数据的选址装置一般设置于服务器或终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的基于大数据的选址方法的一个实施例的流程图。所述的基于大数据的选址方法,包括以下步骤:
步骤S201,获取待选址对象的定位信息和目标客户群,根据定位信息和目标客户群建立选址对象画像。
需要说明的是,待选址对象是需要在线下布局的商铺或者门店。通常,为了更好地在城市内进行线下布局,则需要根据待选址对象的定位信息和针对的目标客户群进行分析,从而为待选址对象选择出合适的开店地址。
在本实施例中,定位信息包括选址对象类型和产品特征,其中,选址对象类型包括银行、美食、服装、美妆、甜点饮品、超市便利、生鲜果蔬等,产品特征包括产品分类、品牌、价格等;目标客户群为待选址对象针对的客户人群。
步骤S202,从预设数据库中获取每个用户的基本特征和用户行为特征,根据基本特征和用户行为特征构建用户画像。
在本实施例中,预设数据库是指包括应用程序、网站等可以获取用户数据的地方。用户基本特征包括性别、年龄、住址以及出行轨迹,用户行为特征包括吃穿住行等生活习惯、购买频率和需求程度等。
举例而言,当用户为车主时,用户的基本特征包括性别、年龄、住址以及经常活动的起止位置,用户的基本特征可以从预设的应用程序中获取,例如交警星级用户APP;用户行为特征包括用户对某选址对象类型的访问次数、访问频率、访问停留时间以及偏好购买物品等,用户行为特征可以通过获取第三方平台所提供的第三方用户数据中获取。其中,第三方用户数据主要是第三方平台通过导航定位用户服务器端的位置信息,并获取在不同位置处的消费信息,从而汇总出用户消费倾向,例如用户利用某个支付APP进行消费支付,APP上就会保留该用户的消费信息以及消费地址,APP后台就会对这些信息进行汇总输出第三方用户数据。
需要强调的是,为进一步保证上述用户的基本特征和用户行为特征的私密和安全性,上述用户的基本特征和用户行为特征还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
步骤S203,根据用户画像之间的相似度,对所有用户进行分类,得到不同的用户类。
在本实施例中,可利用聚类算法对用户进行分类,其中,聚类算法包括但限于K均值聚类算法、均值漂移聚类算法、基于密度的聚类算法。
本实施例中,根据用户画像之间的相似度,对所有用户进行聚类,可将用户划分到多个用户类类簇中,同一个类簇中的用户偏好相似。由此,经过聚类后,可将偏好相似的用户划分到一起,得到多个偏好不同的群体。
步骤S204,基于选址对象画像和所述用户类确定备选地址。
本实施例中,根据选址对象画像对每类用户进行分析,分析每类用户与待选址对象的匹配度,从而为选址对象确定备选地址。
本申请通过获取待选址对象的定位信息和目标客户群,根据定位信息和目标客户群建立选址对象画像,从预设数据库中获取每个用户的基本特征和用户行为特征,根据基本特征和用户行为特征构建用户画像,然后根据用户画像之间的相似度,对所有用户进行分类,得到不同的用户类,基于选址对象画像和分类结果确定备选地址;通过构建的选址对象画像和用户画像进行选址,在大数据的支持下,使得选址不再盲目,选址更加全面可靠,提高选址的准确性,进一步实现用户群体的精准定位。
在本实施例的一些可选的实现方式中,参见图3所示,步骤S201的根据定位信息和目标客户群建立选址对象画像的方法具体包括以下步骤:
步骤S301,对定位信息和目标客户群分别进行特征提取,得到对应的选址对象特征和目标客户特征。
具体地,定位信息可以根据选址对象类型和产品特征进行特征提取,目标客户群可以根据群体中每个客户的基本特征和行为特征进行特征提取,可以采用但不限于基于TextRank算法关键词提取、TF-IDF算法来进行特征提取。
步骤S302,根据选址对象特征和目标客户特征生成目标客户标签以及目标客户标签对应的权重。
本实施例中,目标客户标签表征了内容,表示目标客户对待选址对象有兴趣、偏好、需求等;权重表征了指数,表示目标客户的兴趣、偏好指数,也可能表征目标客户的需求度,可以简单的理解为可信度,概率等。例如,将某两位目标客户打上标签和赋予权重记为:A目标客户饮品0.8,B目标客户某品牌0.6,则“A目标客户饮品0.8”表示A目标客户喜欢饮品的程度为80%,“B目标客户某品牌0.6”表示B目标客户喜欢某品牌的程度为60%。
在一些可选的实现方式中,步骤S302的具体方法包括如下步骤:
基于选址对象特征和目标客户特征对目标客户群进行分类,并给不同类别的目标客户标定具有目标客户群特点的目标客户标签;
根据目标客户标签出现的频率或比重为目标客户标签赋予权重。
具体地,目标客户标签可以根据实际需要分为产品需求、消费特征、渠道特征以及轨迹特征等。其中,渠道特征是指目标客户的消费方式为线上消费还是线下消费,具体为刷卡支付、现金支付或者是扫码支付等;轨迹特征是指目标客户的出行方式、出行轨迹以及活动范围。
根据目标客户标签出现的频率或比重为目标客户标签赋予权重,举例说明,美妆类产品的目标客户在美妆产品中,购买档次等级1的概率是0.6,购买档次等级2的概率是0.2,购买档次等级3的概率是0.1,则根据概率的不同赋予不同的权重,概率越大则权重越大。需要说明的是,美妆产品的等级是根据产品品牌的定位、产品的知名度以及产品品牌的历史等进行划分的,概率则是购买某一等级产品次数占所有产品购买次数总和的比重。
通过按照分类结果给不同目标客户标定具有目标客户群特点的目标客户标签,并根据目标客户标签出现的频率或比重为目标客户标签赋予权重,可以提高后续构建选址对象画像的准确性。
步骤S303,根据目标客户标签以及目标客户标签对应的权重构建选址对象画像。
本申请通过对定位信息和目标客户群分别进行特征提取,得到对应的选址对象特征和目标客户特征,根据选址对象特征和目标客户特征生成目标客户标签以及目标客户标签对应的权重,根据目标客户标签以及目标客户标签对应的权重构建选址对象画像,通过目标客户标签以及目标客户标签对应的权重构建选址对象画像,使得构建的选址对象画像更加全面准确。
在本实施例的一些可选的实现方式中,步骤S202的方法具体包括如下步骤:
根据基本特征和用户行为特征生成用户标签以及用户标签对应的权重;
根据用户标签以及用户标签对应的权重构建用户画像。
用户标签表示用户对产品的兴趣、偏好、需求等;权重表示用户对产品的兴趣偏好指数。在本实施例中,可以根据用户标签出现的频率或比重为用户标签赋予权重,具体方法同上述根据目标客户标签出现的频率或比重为目标客户标签赋予权重,此处不再赘述。
本申请通过根据用户标签以及用户标签对应的权重构建用户画像,使得构建的用户画像更加全面准确。
在一些可选的实现方式中,参见图4所示,步骤S203的具体方法包括以下步骤:
步骤S401,从所有用户中随机选取预设个数的第一用户,分别将第一用户设定为一个类簇的中心点;其中,预设个数为聚类出的类簇的个数。
例如,如果试图聚类出的类簇的个数为10个,则从所有用户中随机选取10个第一用户,分别将第一用户设定为一个类簇的中心点,从而可以得到预设个数为10的类簇的中心点。
步骤S402,将除第一用户之外的用户根据用户画像,分别聚类到与第一用户的用户画像相似度最接近的所述类簇中。
作为一种可能的实现方式,针对剩余的每个用户,根据用户的用户画像和类簇的中心点,获取用户与每个类簇的中心点之间的相似度,将用户聚类到与中心点的相似度最高的类簇中。
在获取用户与中心点之间的相似度时,可先获取用户的用户画像中每个标签与中心点中对应标签之间的相似度。具体地,可采用欧式距离、曼哈顿距离、余弦相似度等计算标签与中心点中对应标签之间的相似度。
步骤S403,基于获取到的类簇中的每个用户的用户画像对中心点进行更新。
在将除第一用户之外剩余的用户聚类后,所有用户被划分到预设个数的类簇中。由于一次聚类,聚类结果准确度不高,可基于获取到类簇中的每个用户的用户画像对中心点进行更新。
作为一个示例,针对每个类簇,可将类簇中所有用户的相同标签的标签数据相加后求平均值,所有标签的标签数据的平均值更新为新的中心点。
步骤S404,基于更新后的中心点对类簇中的用户重新进行聚类,直到更新出的类簇中,包括的用户与前一次聚类后类簇包括的用户相同则停止重新聚类,得到目标区域的所有类簇。
本实施例中,在更新完中心点后,可根据步骤S402中的方法重新进行聚类,之后更新中心点,直到更新出的类簇中包括的用户与前一次聚类后类簇包括的用户相同,也就是聚类收敛,则停止重新聚类,最终得到所有类簇。
本实施例中通过聚类将相似度高的用户聚合在一起,更新聚类中心直至收敛是为了提高聚类结果的准确性。
在一些可选的实现方式中,参见图5所示,步骤S204的具体包括以下步骤:
步骤S501,计算选址对象画像与每类用户的用户画像之间的匹配度。
具体地,计算目标客户群与每个用户类之间的相似度,并将相似度确定为待选址对象与每类用户的匹配度。
本实施例中,可以采用包括但不限于余弦相似度、杰卡德系数计算相似度,具体地,可以根据目标客户标签以及目标客户标签对应的权重和用户标签以及用户标签对应的权重,计算目标客户群与每类用户之间的相似度,将相似度确定为待选址对象与每类用户的匹配度,相似度越高,则匹配度越高。
本实施例中通过相似度来确定匹配度,可以使得待选址对象的选址更可靠准确,从而实现待选址对象对目标客户群的精准定位。
步骤S502,筛选出匹配度最高的预设数量的用户类,并根据用户类确定待选址对象的备选地址。
应当理解,用户类中每个用户的用户画像包括用户的轨迹特征等,根据用户的轨迹特征可以确定用户经常的活动范围,根据用户类内所有用户的活动范围来确定待选址对象的位置。
本申请中通过计算选址对象画像与每类用户的用户画像之间的匹配度,并根据匹配度为待选址对象选择地址,可以提高待选址对象选址的准确性。
本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请可应用于智慧社区领域中,从而推动智慧城市的建设。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图6,作为对上述图2所示方法的实现,本申请提供了一种基于大数据的选址装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例所述的基于大数据的选址装置600包括:选址对象画像构建模块601、用户画像构建模块602、分类模块603以及选址模块604。其中:
选址对象画像构建模块601用于获取待选址对象的定位信息和目标客户群,根据所述定位信息和目标客户群建立选址对象画像;
用户画像构建模块602用于从预设数据库中获取每个用户的基本特征和用户行为特征,根据所述基本特征和所述用户行为特征构建用户画像;
分类模块603用于根据所述用户画像之间的相似度,对所有用户进行分类,得到不同的用户类;
选址模块604用于基于所述选址对象画像和所述用户类确定备选地址。
需要强调的是,为进一步保证上述用户的基本特征和用户行为特征的私密和安全性,上述用户的基本特征和用户行为特征还可以存储于一区块链的节点中。
上述基于大数据的选址装置,获取待选址对象的定位信息和目标客户群,根据定位信息和目标客户群建立选址对象画像,从预设数据库中获取每个用户的基本特征和用户行为特征,根据基本特征和用户行为特征构建用户画像,然后根据用户画像之间的相似度,对所有用户进行分类,得到不同的用户类,基于选址对象画像和分类结果确定备选地址;通过构建的选址对象画像和用户画像进行选址,在大数据的支持下,使得选址不再盲目,选址更加全面可靠,提高选址的准确性,进一步实现用户群体的精准定位。
在本实施例的一些可选的实现方式中,选址对象画像构建模块601具体包括特征提取子模块、生成子模块、构建子模块;
特征提取子模块用于对定位信息和目标客户群分别进行特征提取,得到对应的选址对象特征和目标客户特征;
生成子模块用于根据选址对象特征和目标客户特征生成目标客户标签以及目标客户标签对应的权重;
构建子模块用于根据目标客户标签以及目标客户标签对应的权重构建选址对象画像。
在一些可选的实现方式中,生成子模块进一步用于基于选址对象特征和目标客户特征对目标客户群进行分类,并给不同类别的目标客户标定具有目标客户群特点的目标客户标签;根据目标客户标签出现的频率或比重为目标客户标签赋予权重。
通过目标客户标签以及目标客户标签对应的权重构建选址对象画像,使得构建的选址对象画像更加全面准确。
在本实施例的一些可选的实现方式中,用户画像构建模块602进一步用于:根据基本特征和用户行为特征生成用户标签以及用户标签对应的权重;根据用户标签以及用户标签对应的权重构建所述用户画像。
通过根据用户标签以及用户标签对应的权重构建用户画像,使得构建的用户画像更加全面准确。
在本实施例的一些可选的实现方式中,分类模块603具体用于:
从所有用户中随机选取预设个数的第一用户,分别将第一用户设定为一个类簇的中心点;其中,预设个数为聚类出的类簇的个数;
将除第一用户之外的用户根据用户画像,分别聚类到与所述第一用户的用户画像相似度最接近的所述类簇中;
基于获取到的类簇中的每个用户的用户画像对中心点进行更新;
基于更新后的中心点对类簇中的用户重新进行聚类,直到更新出的类簇中,包括的用户与前一次聚类后类簇包括的用户相同则停止重新聚类,得到目标区域的所有类簇。
通过聚类将相似度高的用户聚合在一起,更新聚类中心直至收敛是为了提高聚类结果的准确性。
在本实施例的一些可选的实现方式中,选址模块604包括计算单元、选址单元,计算单元用于计算所述选址对象画像与每类用户的用户画像之间的匹配度;选址单元用于筛选出所述匹配度最高的预设数量的用户类,并根据所述用户类确定待选址对象的备选地址。
在一些可选的实现方式中,计算单元进一步用于计算目标客户群与每个用户类之间的相似度,并将所述相似度确定为所述待选址对象与所述每类用户的匹配度。
通过计算选址对象画像与每类用户的用户画像之间的匹配度,并根据匹配度为待选址对象选择地址,可以提高待选址对象选址的准确性。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
所述计算机设备7包括通过***总线相互通信连接存储器71、处理器72、网络接口73。需要指出的是,图中仅示出了具有组件71-73的计算机设备7,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器71至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器71可以是所述计算机设备7的内部存储单元,例如该计算机设备7的硬盘或内存。在另一些实施例中,所述存储器71也可以是所述计算机设备7的外部存储设备,例如该计算机设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器71还可以既包括所述计算机设备7的内部存储单元也包括其外部存储设备。本实施例中,所述存储器71通常用于存储安装于所述计算机设备7的操作***和各类应用软件,例如基于大数据的选址方法的计算机可读指令等。此外,所述存储器71还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器72在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器72通常用于控制所述计算机设备7的总体操作。本实施例中,所述处理器72用于运行所述存储器71中存储的计算机可读指令或者处理数据,例如运行所述基于大数据的选址方法的计算机可读指令。
所述网络接口73可包括无线网络接口或有线网络接口,该网络接口73通常用于在所述计算机设备7与其他电子设备之间建立通信连接。
本实施例通过处理器执行存储在存储器的计算机可读指令时实现如上述实施例基于大数据的选址方法的步骤,通过构建的选址对象画像和用户画像进行选址,在大数据的支持下,使得选址不再盲目,选址更加全面可靠,提高选址的准确性,进一步实现用户群体的精准定位。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于大数据的选址方法的步骤,通过构建的选址对象画像和用户画像进行选址,在大数据的支持下,使得选址不再盲目,选址更加全面可靠,提高选址的准确性,进一步实现用户群体的精准定位。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种基于大数据的选址方法,其特征在于,包括下述步骤:
获取待选址对象的定位信息和目标客户群,根据所述定位信息和目标客户群建立选址对象画像;
从预设数据库中获取每个用户的基本特征和用户行为特征,根据所述基本特征和所述用户行为特征构建用户画像;
根据所述用户画像之间的相似度,对所有用户进行分类,得到不同的用户类;及
基于所述选址对象画像和所述用户类确定备选地址。
2.根据权利要求1所述的基于大数据的选址方法,其特征在于,所述根据所述定位信息和目标客户群建立选址对象画像的步骤包括:
对所述定位信息和所述目标客户群分别进行特征提取,得到对应的选址对象特征和目标客户特征;
根据所述选址对象特征和目标客户特征生成目标客户标签以及所述目标客户标签对应的权重;
根据所述目标客户标签以及所述目标客户标签对应的权重构建选址对象画像。
3.根据权利要求2所述的基于大数据的选址方法,其特征在于,所述根据所述选址对象特征和目标客户特征生成目标客户标签以及所述目标客户标签对应的权重的步骤包括:
基于所述选址对象特征和所述目标客户特征对目标客户群进行分类,并给不同类别的目标客户标定具有所述目标客户群特点的目标客户标签;
根据所述目标客户标签出现的频率或比重为所述目标客户标签赋予权重。
4.根据权利要求1所述的基于大数据的选址方法,其特征在于,所述根据所述基本特征和所述用户行为特征构建用户画像的步骤包括:
根据所述基本特征和所述用户行为特征生成用户标签以及用户标签对应的权重;
根据所述用户标签以及用户标签对应的权重构建所述用户画像。
5.根据权利要求1所述的基于大数据的选址方法,其特征在于,所述根据所述用户画像之间的相似度,对所有用户进行分类的步骤包括:
从所有用户中随机选取预设个数的第一用户,分别将第一用户设定为一个类簇的中心点;其中,预设个数为聚类出的类簇的个数;
将除所述第一用户之外的用户根据用户画像,分别聚类到与所述第一用户的用户画像相似度最接近的所述类簇中;
基于获取到的类簇中的每个用户的用户画像对中心点进行更新;
基于更新后的中心点对类簇中的用户重新进行聚类,直到更新出的类簇中包括的用户,与前一次聚类后类簇包括的用户相同,则停止重新聚类,得到目标区域的所有类簇。
6.根据权利要求1所述的基于大数据的选址方法,其特征在于,所述基于所述选址对象画像和所述用户类确定备选地址的步骤包括:
计算所述选址对象画像与每类用户的用户画像之间的匹配度;
筛选出所述匹配度最高的预设数量的用户类,并根据所述用户类确定待选址对象的备选地址。
7.根据权利要求6所述的基于大数据的选址方法,其特征在于,所述计算所述选址对象画像与每类用户的用户画像之间的匹配度的步骤包括:
计算目标客户群与每个用户类之间的相似度;
将所述相似度确定为所述待选址对象与所述每类用户的匹配度。
8.一种基于大数据的选址装置,其特征在于,包括:
选址对象画像构建模块,用于获取待选址对象的定位信息和目标客户群,根据所述定位信息和目标客户群建立选址对象画像;
用户画像构建模块,用于从预设数据库中获取每个用户的基本特征和用户行为特征,根据所述基本特征和所述用户行为特征构建用户画像;
分类模块,用于根据所述用户画像之间的相似度,对所有用户进行分类,得到不同的用户类;及
选址模块,用于基于所述选址对象画像和分类结果确定备选地址。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于大数据的选址方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于大数据的选址方法的步骤。
CN202011104776.XA 2020-10-15 2020-10-15 基于大数据的选址方法、装置、计算机设备及存储介质 Pending CN112215658A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011104776.XA CN112215658A (zh) 2020-10-15 2020-10-15 基于大数据的选址方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011104776.XA CN112215658A (zh) 2020-10-15 2020-10-15 基于大数据的选址方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN112215658A true CN112215658A (zh) 2021-01-12

Family

ID=74054713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011104776.XA Pending CN112215658A (zh) 2020-10-15 2020-10-15 基于大数据的选址方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112215658A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112783984A (zh) * 2021-02-10 2021-05-11 中国人民银行数字货币研究所 一种信息展示方法和装置
CN113379464A (zh) * 2021-06-29 2021-09-10 北京百度网讯科技有限公司 基于区块链的网点选址方法、装置、设备和存储介质
CN113449922A (zh) * 2021-07-09 2021-09-28 中国银行股份有限公司 银行网点选址方法及装置
CN113706222A (zh) * 2021-09-18 2021-11-26 口碑(上海)信息技术有限公司 一种门店选址的方法、装置
CN113743999A (zh) * 2021-11-08 2021-12-03 江苏荣泽信息科技股份有限公司 基于区块链的多区域营销策略用连锁品牌选址管理***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750751A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 轨迹数据标注方法及装置
CN108108451A (zh) * 2017-12-27 2018-06-01 合肥美的智能科技有限公司 群体的群体用户画像获取方法和装置
CN109377328A (zh) * 2018-12-19 2019-02-22 口口相传(北京)网络技术有限公司 商家门店地理位置的推荐方法及装置
CN111626777A (zh) * 2020-05-25 2020-09-04 泰康保险集团股份有限公司 选址方法、选址决策***、存储介质及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750751A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 轨迹数据标注方法及装置
CN108108451A (zh) * 2017-12-27 2018-06-01 合肥美的智能科技有限公司 群体的群体用户画像获取方法和装置
CN109377328A (zh) * 2018-12-19 2019-02-22 口口相传(北京)网络技术有限公司 商家门店地理位置的推荐方法及装置
CN111626777A (zh) * 2020-05-25 2020-09-04 泰康保险集团股份有限公司 选址方法、选址决策***、存储介质及电子设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112783984A (zh) * 2021-02-10 2021-05-11 中国人民银行数字货币研究所 一种信息展示方法和装置
CN113379464A (zh) * 2021-06-29 2021-09-10 北京百度网讯科技有限公司 基于区块链的网点选址方法、装置、设备和存储介质
CN113379464B (zh) * 2021-06-29 2023-12-05 北京百度网讯科技有限公司 基于区块链的网点选址方法、装置、设备和存储介质
CN113449922A (zh) * 2021-07-09 2021-09-28 中国银行股份有限公司 银行网点选址方法及装置
CN113706222A (zh) * 2021-09-18 2021-11-26 口碑(上海)信息技术有限公司 一种门店选址的方法、装置
CN113706222B (zh) * 2021-09-18 2023-12-22 口碑(上海)信息技术有限公司 一种门店选址的方法、装置
CN113743999A (zh) * 2021-11-08 2021-12-03 江苏荣泽信息科技股份有限公司 基于区块链的多区域营销策略用连锁品牌选址管理***
CN113743999B (zh) * 2021-11-08 2022-02-11 江苏荣泽信息科技股份有限公司 基于区块链的多区域营销策略用连锁品牌选址管理***

Similar Documents

Publication Publication Date Title
CN112215658A (zh) 基于大数据的选址方法、装置、计算机设备及存储介质
US10235425B2 (en) Entity fingerprints
WO2021174944A1 (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN110009401A (zh) 基于用户画像的广告投放方法、装置和存储介质
CN112287244A (zh) 基于联邦学习的产品推荐方法、装置、计算机设备及介质
US10074097B2 (en) Classification engine for classifying businesses based on power consumption
CN113220734A (zh) 课程推荐方法、装置、计算机设备及存储介质
US20180012284A1 (en) Information analysis apparatus, information analysis method, and non-transitory computer readable storage medium
WO2020150611A1 (en) Systems and methods for entity performance and risk scoring
US20090072946A1 (en) Collaborative product authentication
CN111369301A (zh) 一种交易评价的方法、装置及终端
CN115033801B (zh) 物品推荐方法、模型训练方法及电子设备
CN113360788A (zh) 一种地址推荐方法、装置、设备及存储介质
CN113516496A (zh) 广告转化率预估模型构建方法、装置、设备及其介质
CN111641517A (zh) 同质网络的社群划分方法、装置、计算机设备和存储介质
WO2020150597A1 (en) Systems and methods for entity performance and risk scoring
CN114240553A (zh) 车辆保险产品的推荐方法、装置、设备及存储介质
CN112766995A (zh) 物品推荐方法、装置、终端设备及存储介质
CN116010707A (zh) 商品价格异常识别方法、装置、设备和存储介质
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN115496420A (zh) 新用户质量评估方法、装置、计算机设备及存储介质
CN115392361A (zh) 一种智能排序方法、装置、计算机设备及存储介质
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN109902698A (zh) 信息生成方法和装置
CN112085566A (zh) 基于智能决策的产品推荐方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination