CN115456695A - 一种店铺选址的分析方法、装置、***及介质 - Google Patents
一种店铺选址的分析方法、装置、***及介质 Download PDFInfo
- Publication number
- CN115456695A CN115456695A CN202211216485.9A CN202211216485A CN115456695A CN 115456695 A CN115456695 A CN 115456695A CN 202211216485 A CN202211216485 A CN 202211216485A CN 115456695 A CN115456695 A CN 115456695A
- Authority
- CN
- China
- Prior art keywords
- dimension
- analysis
- dimensions
- sample
- shop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
- G06Q30/0205—Location or geographical consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种店铺选址的分析方法、装置、***及介质,包括:对预先采集的训练集进行样本扩充和样本平衡处理;根据现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据;对基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度;根据样本处理后的训练集和关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型;将待分析的目标位置输入至选址分析模型中,得到选址分析模型输出的位置评估结果。通过采集现有店铺的店铺数据,基于对基本维度和复合维度筛选得到的关键分析维度对不同业态分布的店铺进行选址分析模型的训练,使模型能基于任意位置输出位置评估结果,提高选址分析的效率和准确性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种店铺选址的分析方法、装置、***及介质。
背景技术
连锁经营是现代商业最为主要的经营形态,在连锁经营中,对店铺是否盈利的因素主要有周边商业环境、店铺硬件设施条件、经营团队管理水平,这其中,连锁店铺的店铺硬件设施条件和经营团队管理水平的差距并不大,所以周边商业环境即店铺选址是影响店铺营业数据的关键因素。
目前,对店铺位置的评估分析主要有两种方式,一种是现场实地考察,观察周边店铺的种类,以及经营繁忙情况,根据个人的经验去评估开店地址的好坏,人为主观性大,非常容易造成评估偏差;或者还有通过采集开店地址周围的人流量数据、临近店铺的进店率以及客单价等等,对店铺营业额进行预估,以此来判断开店位置的好坏,这种方式数据采集过程繁杂,需花费大量的人力物力,导致分析效率低下。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种店铺选址的分析方法、装置、***及介质,旨在提高店铺选址评估分析的效率和准确性。
本发明的技术方案如下:
一种店铺选址的分析方法,包括:
对预先采集的训练集进行样本扩充和样本平衡处理,其中,所述训练集包括现有店铺的店铺数据;
根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据;
对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度;
根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型;
将待分析的目标位置输入至所述选址分析模型中,得到所述选址分析模型输出的位置评估结果。
在一个实施例中,所述对预先采集的训练集进行样本扩充和样本平衡处理,包括:
对预先采集的训练集进行正样本扩量处理;
对预先采集的训练集进行负样本扩量处理;
对正样本和负样本的数量进行平衡处理,使得正样本与负样本的比例达到预设比例。
在一个实施例中,所述对预先采集的训练集进行正样本扩量处理,包括:
根据所述店铺数据,采集与目标品牌同类型的相似店铺数据作为正样本,对所述训练集进行正样本扩量处理。
在一个实施例中,所述对预先采集的训练集进行负样本扩量处理,包括:
根据所述店铺数据,获取目标品牌的门店分布比例高于预设比例的城市并调取所述城市的Geohash数据;
对所述城市的Geohash数据进行过滤,筛选得到业态分布指标大于预设指标的目标区域;
将所述现有店铺的Geohash数据***至所述目标区域的Geohash数据中,将所述目标区域划分为有目标品牌区域和无目标品牌区域;
在所述无目标品牌区域中,确认业态分布信息与所述有目标品牌区域相似的区域作为负样本,对所述训练样本集进行负样本扩量处理。
在一个实施例中,所述根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度,包括:
根据所述现有店铺的业态分布信息进行相应辐射范围内的业态分布统计,得到基本维度的分布数据;
对至少两个基本维度的分布数据进行预设运算处理,得到复合维度的分布数据。
在一个实施例中,所述对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度,包括:
根据所述现有店铺的业态分布信息,计算每个分析维度的IV值以及不同分析维度之间的相关系数,所述分析维度包括基本维度和复合维度;
将所述IV值处于预设范围的分析维度确认为候选维度;
确认所述候选维度中两两分析维度之间的相关系数是否大于预设阈值,若是,则去除IV值更小的分析维度,直到所述候选维度中两两分析维度之间的相关系数均小于预设阈值,则得到关键分析维度。
在一个实施例中,所述根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型,包括:
将所述训练集中现有店铺的店铺数据以及所述关键分析维度的分布数据输入至多元回归模型中,进行模型拟合训练;
在达到预设拟合条件时结束模型训练,输出每个关键分析维度的权重系数以及整体偏移量,得到选址分析模型。
一种店铺选址的分析装置,包括:
样本处理模块,用于对预先采集的训练集进行样本扩充和样本平衡处理,其中,所述训练集包括现有店铺的店铺数据;
维度处理模块,用于根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据;
维度筛选模块,用于对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度;
模型训练模块,用于根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型;
分析模块,用于将待分析的目标位置输入至所述选址分析模型中,得到所述选址分析模型输出的位置评估结果。
一种店铺选址的分析***,所述***包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述店铺选址的分析方法。
一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的店铺选址的分析方法。
有益效果:本发明公开了一种店铺选址的分析方法、装置、***及介质,相比于现有技术,本发明实施例通过采集现有店铺的店铺数据,基于对基本维度和复合维度筛选得到的关键分析维度对不同业态分布的店铺进行选址分析模型的训练,使模型能基于任意位置输出位置评估结果,提高选址分析的效率和准确性。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明实施例提供的店铺选址的分析方法的一个流程图;
图2为本发明实施例提供的店铺选址的分析装置的功能模块示意图;
图3为本发明实施例提供的店铺选址的分析***的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。以下结合附图对本发明实施例进行介绍。
请参阅图1,图1为本发明提供的店铺选址的分析方法一个实施例的流程图。如图1所示,该方法具体包括如下步骤:
S100、对预先采集的训练集进行样本扩充和样本平衡处理,其中,所述训练集包括现有店铺的店铺数据。
本实施例中,预先采集现有店铺的店铺数据构建得到训练集,具体的店铺数据可以包括店铺品牌、店铺类型、店铺位置、店铺营业数据等等,由于连锁品牌存在大量的现有店铺,包括线下续存的或者已关闭的店铺,这些现有店铺均可为模型训练提供大量的样本数据来寻找店铺与周边环境之间的内在关系。并且,为了进一步丰富训练样本,对预先采集到的训练集进一步进行样本处理,包括样本扩充和样本平衡,以提高训练样本的多样性,有利于训练得到更加准确的分析模型。
在一个实施例中,步骤S100包括:
对预先采集的训练集进行正样本扩量处理;
对预先采集的训练集进行负样本扩量处理;
对正样本和负样本的数量进行平衡处理,使得正样本与负样本的比例达到预设比例。
本实施例中,由于用户提供的现有店铺可能样本数量较少,为提高后续模型训练的准确性以及样本的丰富程度,先对训练样本集分布进行正样本扩量处理和负样本扩量处理,可以理解的是,本实施例对样本扩充处理的顺序不作限定,在扩充得到了相应数量的正样本和负样本之后,则对两种扩量的样本进行平衡处理,使二者的比例达到预设比例,优选地,控制正样本和负样本的比例接近1:1,具体可根据实际需求灵活设置预设比例,本实施例不作限定。
在一个实施例中,所述对预先采集的训练集进行正样本扩量处理,包括:
根据所述店铺数据,采集与目标品牌同类型的相似店铺数据作为正样本,对所述训练集进行正样本扩量处理。
本实施例中,在对训练集进行正样本扩量处理时,根据现有店铺的店铺数据,包括现有店铺的目标品牌、目标类型等,采集与目标品牌同类型的相似店铺数据,即获取与现有店铺相似品牌、相似类型的店铺。例如,训练集中的现有店铺是某咖啡连锁品牌A,则可使用咖啡品牌B的店铺数据作为正样本,对训练集进行正样本扩量处理。
在一个实施例中,所述对预先采集的训练集进行负样本扩量处理,包括:
根据所述店铺数据,获取目标品牌的门店分布比例高于预设比例的城市并调取所述城市的Geohash数据;
对所述城市的Geohash数据进行过滤,筛选得到业态分布指标大于预设指标的目标区域;
将所述现有店铺的Geohash数据***至所述目标区域的Geohash数据中,将所述目标区域划分为有目标品牌区域和无目标品牌区域;
在所述无目标品牌区域中,确认业态分布信息与所述有目标品牌区域相似的区域作为负样本,对所述训练样本集进行负样本扩量处理。
本实施例中,针对负样本扩量处理则通过Geohash辨别方式生成,Geohash是空间索引的一种方式,其基本原理是将地球理解为一个二维平面,通过把二维的空间经纬度数据编码为一个字符串,可以把平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码,以Geohash方式建立空间索引,可以提高对空间POI(Point ofinteresting,兴趣点)数据进行经纬度检索的效率。
在进行负样本扩量时,基于店铺数据确认现有店铺的目标品牌,先获取目标品牌的门店分布最集中(例如分布比例前三或者分布比例大于预设比例)的城市,调取城市的Geohash数据,之后筛选城市中有商业活动的目标区域,具体是对城市的Geohash数据进行过滤,筛选Geohash中餐饮和零售的POI数量大于5的目标区域,根据现有店铺的店铺位置即经纬度数据,将对应的门店Geohash数据***至目标区域的Geohash数据中,进而将商业活动的目标区域划分为有目标品牌和无目标品牌的两种区域,基于两种区域的业态分布信息,即门店周边的业态类型与数量等,在无目标品牌区域中选择业态分布信息与有目标品牌区域相似的区域作为负样本,完成负样本的自动生成,以丰富训练样本,提高模型训练的准确性。
进一步地,由于用户提供的店铺数据中,店铺位置一般仅包含省、市、区、详细地址等文本形式的地址信息,为确保后续模型训练时数据的统一性和识别效率,在进行样本扩充处理前还可对店铺数据中的店铺位置进行预处理,将店铺数据中的店铺位置转换为数字化的经纬度数据,便于后续处理,提高模型训练效率和准确性。
S200、根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据。
本实施例中,训练时通过分析现有店铺的店铺数据包括不同位置处店铺的经营情况,采用现有店铺周围的业态分布情况作为分析维度,挖掘现有店铺与周边商业环境维度之间的内在关系。具体的分析维度包括餐饮和零售两大类POI的所有三级分类,以及社会关键配套设施包括学校、医院、农贸市场、公园、景区、高级酒店等,本实施例中针对预先设置的分析维度还进一步进行维度处理,对店铺周边的业态进行分类统计以及运算等处理,得到基本维度和复合维度的分布数据,从而通过基本维度与复合维度的维度组合,实现更加多样化的店铺分析角度,提高模型的鲁棒性。
在一个实施例中,步骤S200包括:
根据所述现有店铺的业态分布信息进行相应辐射范围内的业态分布统计,得到基本维度的分布数据;
对至少两个基本维度的分布数据进行预设运算处理,得到复合维度的分布数据。
本实施例中,在进行分析维度处理时,针对基本维度,以周边业态的分类统计信息作为基本维度的分布数据,由于对于不同的三级业态,应考虑到辐射范围的差异。例如粥粉面的小吃品类,主要的客群对象是附近200米的居住和办公人口;品牌湘菜馆的辐射范围会更大,可能扩大到1000米甚至以上;而学校、医院这类关键配套设施的影响范围会更大,因此基本维度就是针对不同业态指定不同的辐射范围,统计此范围之内该三级业态POI的总数,作为基本维度的分布数据。
针对复合维度,则对至少两个基本维度的分布数据进行预设运算处理,例如加、减、除等运算后得到复合维度的分布数据,具体可根据实际需求设置复合维度的生成规则,例如对于POI数据来说,考虑当前位置与周边位置在数量和结构上的差异,有利于分析当前所处位置在商圈中的层级,同时在POI分类中,学校、医院为民生必备的关键设施配套,农贸市场、商业中心、酒店也是民生要素,分析区域内餐饮、零售与关键配套设施的比值,可以给出区域的属性。因此复合维度可设置为某个三级业态当前区域分布数据对比周边区域分布数据得到的复合维度分布,以及关键配套设施数量对比餐饮、零售数量得到的复合维度分布等等。
S300、对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度。
本实施例中,由于POI三级分类数量较多,且处理得到的包括基本维度和复合维度在内的维度组合更是增加了分析维度的数量,若所有维度均参与模型训练造成模型的不稳定,所以在模型训练之前,需要对参与训练的关键分析维度进行选择,寻找出影响店铺位置好坏的关键分析维度,即筛选具有预测能力的分析维度来进行模型训练,以提高模型的训练效率和可靠性。
在一个实施例中,步骤S300包括:
根据所述现有店铺的业态分布信息,计算每个分析维度的IV值以及不同分析维度之间的相关系数,所述分析维度包括基本维度和复合维度;
将所述IV值处于预设范围的分析维度确认为候选维度;
确认所述候选维度中两两分析维度之间的相关系数是否大于预设阈值,若是,则去除IV值更小的分析维度,直到所述候选维度中两两分析维度之间的相关系数均小于预设阈值,则得到关键分析维度。
本实施例中,通过IV值即信息价值(Information Value)来表征各个分析维度的预测能力,同时还计算不同分析维度之间的相关系数,以保证不同分析维度之间的独立性,在筛选关键分析维度时,需同时考虑分析维度自身的IV值以及与其它分析维度之间的相关系数,从而筛选得到既有预测能力且独立的关键分析维度。
具体地,在基于现有店铺的业态分布信息计算每个分析维度的IV值时,首先计算WOE参数,计算公式为其中,pyi是第i组中响应客户占所有响应客户的比例(响应客户指模型中预测变量即分析维度取值为“是”或者为“1”的个体),pni是第i组中未响应客户占所有未响应客户的比例,yi是第i组中响应客户的数量,ni是第i组中未响应客户的数量,yT是样本中所有响应客户的数量,nT是样本中所有未响应客户的数量。
IV值的计算基于WOE参数,可以看成是对WOE参数的加权求和,对于一个分组后的变量,第i组的WOE如公式上所示,同样对于第i组也会有一个对应的IV值,计算公式为IV值在WOE的基础上保证了结果非负,根据变量在各分组上的IV值,可得到整个变量的IV值为其中n为变量分组个数。
计算得到IV值后,基于IV值的大小选择处于预设范围的分析维度作为候选维度,具体选择IV值大于0.02且小于0.5的作为候选维度。
由于两两分析维度之间可能存在一定的相关性,例如粥粉面店铺周围很大概率上也会有卤味店铺,或者复合维度有可能和参与运算的某个简单维度之间存在相关性,因此为保证筛选出来的关键分析维度之间的独立性,针对候选维度,进一步确认其中两两分析维度之间的相关系数是否大于预设阈值,具体通过Pandas中的corr方法,即Pearson相关系数表征维度之间的相关性,当Pearson相关系数大于0.6时,则认为两个分析维度之间强相关,因此若确认两两分析维度之间的相关系数大于预设阈值时,则去除二者中IV值更小的分析维度,选取其中IV值更大的分析维度作为关键分析维度,直到候选维度中的全部分析维度均满足相关系数小于预设阈值,即可得到既具有预测能力且相互独立的关键分析维度。
S400、根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型。
本实施例中,在筛选得到关键分析维度后,根据样本扩充和样本平衡处理后的训练集,以及包括基本维度和复合维度的关键分析维度的分布数据即POI数据,对预设模型进行拟合训练得到选址分析模型,具体的选址分析模型是作为自变量的关键分析维度与作为因变量的店铺位置好坏(店铺盈利或亏损)之间的函数关系,以实现对未来店铺选址的评估判断。
在一个实施例中,步骤S400包括:
将所述训练集中现有店铺的店铺数据以及所述关键分析维度的分布数据输入至多元回归模型中,进行模型拟合训练;
在达到预设拟合条件时结束模型训练,输出每个关键分析维度的权重系数以及整体偏移量,得到选址分析模型。
本实施例中,具体的预设模型采用多元回归模型,将训练集中现有店铺的店铺数据以及关键分析维度的分布数据输入到多元回归模型中,进行模型拟合训练,本实施例采用逻辑回归进行模型训练,相比于线性回归,逻辑回归的稳定性更强,拟合训练过程为以筛选出的基本维度和复合维度的分布数据作为自变量,店铺营业状态(店铺盈利或店铺亏损)作为因变量完成因果关系的训练,在达到预设拟合条件时则结束模型训练,例如拟合优度大于预设值或者训练次数大于预设次数等等,训练完成后则会输出每个关键分析维度的权重系数以及整体偏移量,进而生成选址分析模型。
S500、将待分析的目标位置输入至所述选址分析模型中,得到所述选址分析模型输出的位置评估结果。
本实施例中,在训练得到了选址分析模型后,针对任意位置的店铺选址分析,若目标位置为经纬度数据,则直接输入到选址分析模型中,若目标位置为地址文本,则将其转换为经纬度数据后输入到选址分析模型中,基于该经纬度数据获取周边关键维度的分布数据,进而通过选址分析模型根据周边关键维度的分布数据输出相应的位置评估结果,实现对目标位置进行店铺盈利与否的预测分析。
相对于仅依靠人流、进店率、客单价的预测方式,本实施例将店铺周边的业态环境、配套环境作为重点的维度进行分析,将基于“人”的分析维度转变为基于“场”的分析维度,弱化随机因素造成的统计困难,减少维度判断误差,提高模型准确性,在模型训练完毕后,可对无限多个有商业行为的目标位置进行预测,相对于线下实地勘测,极大提高预测效率。
本发明另一实施例提供一种店铺选址的分析装置,如图2所示,装置1包括:
样本处理模块11,用于对预先采集的训练集进行样本扩充和样本平衡处理,其中,所述训练集包括现有店铺的店铺数据;
维度处理模块12,用于根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据;
维度筛选模块13,用于对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度;
模型训练模块14,用于根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型;
分析模块15,用于将待分析的目标位置输入至所述选址分析模型中,得到所述选址分析模型输出的位置评估结果。
本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述店铺选址的分析的执行过程,各模块的具体实施方式请参考上述对应的方法实施例,此处不再赘述。
本发明另一实施例提供一种店铺选址的分析***,如图3所示,***10包括:
一个或多个处理器110以及存储器120,图3中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图3中以通过总线连接为例。
处理器110用于完成***10的各种控制逻辑,其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(Acorn RISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的店铺选址的分析方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行***10的各种功能应用以及数据处理,即实现上述方法实施例中的店铺选址的分析方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据***10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至***10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的店铺选址的分析方法,例如,执行以上描述的图1中的方法步骤S100至步骤S500。
本发明实施例提供了一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤S100至步骤S500。
作为示例,非易失性存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明而非限制,RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
综上,本发明公开的一种店铺选址的分析方法、装置、***及介质中,方法通过对预先采集的训练集进行样本扩充和样本平衡处理;根据现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据;对基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度;根据样本处理后的训练集和关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型;将待分析的目标位置输入至选址分析模型中,得到选址分析模型输出的位置评估结果。通过采集现有店铺的店铺数据,基于对基本维度和复合维度筛选得到的关键分析维度对不同业态分布的店铺进行选址分析模型的训练,使模型能基于任意位置输出位置评估结果,提高选址分析的效率和准确性。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的计算机程序可存储于一非易失性计算机可读取的存储介质中,该计算机程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、软盘、闪存、光存储器等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种店铺选址的分析方法,其特征在于,包括:
对预先采集的训练集进行样本扩充和样本平衡处理,其中,所述训练集包括现有店铺的店铺数据;
根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据;
对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度;
根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型;
将待分析的目标位置输入至所述选址分析模型中,得到所述选址分析模型输出的位置评估结果。
2.根据权利要求1所述的店铺选址的分析方法,其特征在于,所述对预先采集的训练集进行样本扩充和样本平衡处理,包括:
对预先采集的训练集进行正样本扩量处理;
对预先采集的训练集进行负样本扩量处理;
对正样本和负样本的数量进行平衡处理,使得正样本与负样本的比例达到预设比例。
3.根据权利要求2所述的店铺选址的分析方法,其特征在于,所述对预先采集的训练集进行正样本扩量处理,包括:
根据所述店铺数据,采集与目标品牌同类型的相似店铺数据作为正样本,对所述训练集进行正样本扩量处理。
4.根据权利要求2所述的店铺选址的分析方法,其特征在于,所述对预先采集的训练集进行负样本扩量处理,包括:
根据所述店铺数据,获取目标品牌的门店分布比例高于预设比例的城市并调取所述城市的Geohash数据;
对所述城市的Geohash数据进行过滤,筛选得到业态分布指标大于预设指标的目标区域;
将所述现有店铺的Geohash数据***至所述目标区域的Geohash数据中,将所述目标区域划分为有目标品牌区域和无目标品牌区域;
在所述无目标品牌区域中,确认业态分布信息与所述有目标品牌区域相似的区域作为负样本,对所述训练样本集进行负样本扩量处理。
5.根据权利要求1所述的店铺选址的分析方法,其特征在于,所述根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度,包括:
根据所述现有店铺的业态分布信息进行相应辐射范围内的业态分布统计,得到基本维度的分布数据;
对至少两个基本维度的分布数据进行预设运算处理,得到复合维度的分布数据。
6.根据权利要求1所述的店铺选址的分析方法,其特征在于,所述对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度,包括:
根据所述现有店铺的业态分布信息,计算每个分析维度的IV值以及不同分析维度之间的相关系数,所述分析维度包括基本维度和复合维度;
将所述IV值处于预设范围的分析维度确认为候选维度;
确认所述候选维度中两两分析维度之间的相关系数是否大于预设阈值,若是,则去除IV值更小的分析维度,直到所述候选维度中两两分析维度之间的相关系数均小于预设阈值,则得到关键分析维度。
7.根据权利要求1所述的店铺选址的分析方法,其特征在于,所述根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型,包括:
将所述训练集中现有店铺的店铺数据以及所述关键分析维度的分布数据输入至多元回归模型中,进行模型拟合训练;
在达到预设拟合条件时结束模型训练,输出每个关键分析维度的权重系数以及整体偏移量,得到选址分析模型。
8.一种店铺选址的分析装置,其特征在于,包括:
样本处理模块,用于对预先采集的训练集进行样本扩充和样本平衡处理,其中,所述训练集包括现有店铺的店铺数据;
维度处理模块,用于根据所述现有店铺的业态分布信息进行分析维度处理,得到基本维度和复合维度的分布数据;
维度筛选模块,用于对所述基本维度和复合维度进行维度筛选,得到符合预设条件的关键分析维度;
模型训练模块,用于根据样本处理后的训练集和所述关键分析维度的分布数据,对预设模型进行拟合训练,得到选址分析模型;
分析模块,用于将待分析的目标位置输入至所述选址分析模型中,得到所述选址分析模型输出的位置评估结果。
9.一种店铺选址的分析***,其特征在于,所述***包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一项所述的店铺选址的分析方法。
10.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-7任一项所述的店铺选址的分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211216485.9A CN115456695A (zh) | 2022-09-30 | 2022-09-30 | 一种店铺选址的分析方法、装置、***及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211216485.9A CN115456695A (zh) | 2022-09-30 | 2022-09-30 | 一种店铺选址的分析方法、装置、***及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115456695A true CN115456695A (zh) | 2022-12-09 |
Family
ID=84308005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211216485.9A Pending CN115456695A (zh) | 2022-09-30 | 2022-09-30 | 一种店铺选址的分析方法、装置、***及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115456695A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116011819A (zh) * | 2023-02-03 | 2023-04-25 | 吉林农业科技学院 | 一种基于大数据的农产品经营风险预测***和方法 |
CN116228080A (zh) * | 2023-01-31 | 2023-06-06 | 上海矽为科技有限公司 | 模型训练方法、终端部署分析方法、装置、设备及介质 |
CN117435824A (zh) * | 2023-12-22 | 2024-01-23 | 山东艾琳智能科技有限公司 | 一种基于互联网的选址筛选*** |
-
2022
- 2022-09-30 CN CN202211216485.9A patent/CN115456695A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116228080A (zh) * | 2023-01-31 | 2023-06-06 | 上海矽为科技有限公司 | 模型训练方法、终端部署分析方法、装置、设备及介质 |
CN116228080B (zh) * | 2023-01-31 | 2023-09-19 | 上海矽为科技有限公司 | 模型训练方法、终端部署分析方法、装置、设备及介质 |
CN116011819A (zh) * | 2023-02-03 | 2023-04-25 | 吉林农业科技学院 | 一种基于大数据的农产品经营风险预测***和方法 |
CN117435824A (zh) * | 2023-12-22 | 2024-01-23 | 山东艾琳智能科技有限公司 | 一种基于互联网的选址筛选*** |
CN117435824B (zh) * | 2023-12-22 | 2024-03-15 | 山东科技职业学院 | 一种基于互联网的选址筛选*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110222267B (zh) | 一种游戏平台信息推送方法、***、存储介质及设备 | |
CN115456695A (zh) | 一种店铺选址的分析方法、装置、***及介质 | |
Binner* et al. | A comparison of linear forecasting models and neural networks: an application to Euro inflation and Euro Divisia | |
Scholl et al. | Detecting spatial clustering using a firm-level cluster index | |
Alfaro-Navarro et al. | A fully automated adjustment of ensemble methods in machine learning for modeling complex real estate systems | |
CN111159564A (zh) | 信息推荐方法、装置、存储介质及计算机设备 | |
CN106251174A (zh) | 信息推荐方法及装置 | |
Balcilar et al. | Housing and the great depression | |
JP2019512764A (ja) | ユーザ地理的ロケーションのタイプを識別するための方法および装置 | |
CN112861972B (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
KR102330423B1 (ko) | 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 | |
Louati et al. | Price forecasting for real estate using machine learning: A case study on Riyadh city | |
Popli et al. | Educational attainment and wage inequality in Turkey | |
Brown et al. | Estimating per‐pixel thematic uncertainty in remote sensing classifications | |
CN110716998B (zh) | 一种精细尺度人口数据空间化方法 | |
Wanke et al. | Revisiting camels rating system and the performance of Asean banks: a comprehensive mcdm/z-numbers approach | |
CN110992194A (zh) | 一种基于含属性的多进程采样图表示学习模型的用户参考指数算法 | |
KR102438923B1 (ko) | 시계열 분포 특징을 고려한 딥러닝 기반 비트코인 블록 데이터 예측 시스템 | |
JP7071948B2 (ja) | 対象地域の不動産の稼働率を推定するプログラム、装置及び方法 | |
CN112667911A (zh) | 一种利用社交软件大数据找寻潜在客户的方法 | |
CN108647189B (zh) | 一种识别用户人群属性的方法及装置 | |
WO2022183019A1 (en) | Methods for mitigation of algorithmic bias discrimination, proxy discrimination and disparate impact | |
JP2008187612A (ja) | トラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体 | |
CN109308565B (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
CN110400160B (zh) | 识别竞品用户的方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |