CN111950753A - 一种景区客流预测的方法及装置 - Google Patents
一种景区客流预测的方法及装置 Download PDFInfo
- Publication number
- CN111950753A CN111950753A CN201910402126.4A CN201910402126A CN111950753A CN 111950753 A CN111950753 A CN 111950753A CN 201910402126 A CN201910402126 A CN 201910402126A CN 111950753 A CN111950753 A CN 111950753A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- training
- model
- scenic spot
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 164
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 21
- 238000011156 evaluation Methods 0.000 claims description 14
- 238000010200 validation analysis Methods 0.000 claims description 13
- 238000012417 linear regression Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 13
- 235000019580 granularity Nutrition 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种景区客流预测的方法及装置,该方法包括获取预测景区的参数信息,根据参数信息,确定预测景区的特征工程,将预测景区的特征工程输入至客流预测模型中,预测预测景区的客流,其中,客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,客流预测模型包括初级训练模型和次级训练模型。通过将特征工程数值至依据初级训练模型和次级训练模型学习得到的客流预测模型中,能够准确的预测到景区的客流,提高了预测准确性。
Description
技术领域
本发明实施例涉及客流预测技术领域,尤其涉及一种景区客流预测的方法及装置。
背景技术
景区客流量数据不仅可以反映景区历史和当前的游客承载量和分布情况,同时还为管理者对未来决策提供数据支持,提高经营效率。而提前做出足够精确的客流预测数据和分析,可以帮助景区管理者得出未来应对景区的一些措施和方案。
因此,为了得到精确的景区客流预测数据,给景区管理者提供实行一些措施和方案时的有效依据,亟需一种多维度景区客流预测的方法。
发明内容
本发明实施例提供一种景区客流预测的方法及装置,用以提高景区客流预测的准确率。
本发明实施例提供的一种景区客流预测的方法,包括:
获取预测景区的参数信息;
根据所述参数信息,确定所述预测景区的特征工程;
将所述预测景区的特征工程输入至客流预测模型中,预测所述预测景区的客流,其中,所述客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,所述客流预测模型包括初级训练模型和次级训练模型。
上述技术方案中,通过将特征工程数值至依据初级训练模型和次级训练模型学习得到的客流预测模型中,能够准确的预测到景区的客流,提高了预测准确性。
可选的,所述对景区的不同场景下的客流进行训练学习得到所述客流预测模型,包括:
获取景区的历史客流信息;
在多个场景下按照预测粒度对所述历史客流进行分析,确定出特征集;
针对所述特征集中每个特征,确定出每个特征对应的特征值,组成第一特征工程;
对所述第一特征工程及其对应的历史客流进行模型训练,确定出所述客流预测模型。
可选的,所述对所述第一特征工程及其对应的历史客流进行模型训练,确定出所述客流预测模型,包括:
将所述第一特征工程及其对应的历史客流组成数据集;并将所述数据集分为初级训练数据和次级训练数据;
使用多种基础算法对所述初级训练数据进行训练得到多个训练完成的基模型;
根据所述次级训练数据和所述多个训练完成的基模型,进行次级训练,得到所述客流预测模型。
可选的,所述根据所述次级训练数据和所述多个训练完成的基模型,进行次级训练,得到所述客流预测模型,包括:
将所述次级训练数据分为训练集和验证集;
将所述训练集分别输入至所述多个训练完成的模型,得到多个预测值;
将所述多个预测值输入至线性回归模型进行次级训练,得到次级训练模型;
使用所述验证集对所述次级训练模型进行评估,得到所述客流预测模型。
可选的,所述使用所述验证集对所述次级训练模型进行评估,得到所述客流预测模型,包括:
根据所述验证集使用R2误差法对所述次级训练模型进行评估,若评估值低于预期值,则重新确定所述第一特征工程,再进行模型训练,直到所述评估值大于等于预期值为止,得到所述客流预测模型。
相应的,本发明实施例还提供了一种景区客流预测的装置,包括:
获取单元,用于获取预测景区的参数信息;
处理单元,用于根据所述参数信息,确定所述预测景区的特征工程;
将所述预测景区的特征工程输入至客流预测模型中,预测所述预测景区的客流,其中,所述客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,所述客流预测模型包括初级训练模型和次级训练模型。
可选的,所述处理单元具体用于:
获取景区的历史客流信息;
在多个场景下按照预测粒度对所述历史客流进行分析,确定出特征集;
针对所述特征集中每个特征,确定出每个特征对应的特征值,组成第一特征工程;
对所述第一特征工程及其对应的历史客流进行模型训练,确定出所述客流预测模型。
可选的,所述处理单元具体用于:
将所述第一特征工程及其对应的历史客流组成数据集;并将所述数据集分为初级训练数据和次级训练数据;
使用多种基础算法对所述初级训练数据进行训练得到多个训练完成的基模型;
根据所述次级训练数据和所述多个训练完成的基模型,进行次级训练,得到所述客流预测模型。
可选的,所述处理单元具体用于:
将所述次级训练数据分为训练集和验证集;
将所述训练集分别输入至所述多个训练完成的模型,得到多个预测值;
将所述多个预测值输入至线性回归模型进行次级训练,得到次级训练模型;
使用所述验证集对所述次级训练模型进行评估,得到所述客流预测模型。
可选的,所述处理单元具体用于:
根据所述验证集使用R2误差法对所述次级训练模型进行评估,若评估值低于预期值,则重新确定所述第一特征工程,再进行模型训练,直到所述评估值大于等于预期值为止,得到所述客流预测模型。
相应的,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述景区客流预测的方法。
相应的,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述景区客流预测的方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种***架构的示意图;
图2为本发明实施例提供的一种景区客流预测的方法的流程示意图;
图3为本发明实施例提供的一种特征工程构建的示意图;
图4为本发明实施例提供的一种模型训练的示意图;
图5为本发明实施例提供的一种初级训练模型的示意图;
图6为本发明实施例提供的一种次级训练模型的示意图;
图7为本发明实施例提供的一种景区客流预测的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示例性的示出了本发明实施例所适用的一种***架构,该***架构可以为服务器100,包括处理器110、通信接口120和存储器130。
其中,通信接口120用于与终端设备进行通信,收发该终端设备传输的信息,实现通信。
处理器110是服务器100的控制中心,利用各种接口和路线连接整个服务器100的各个部分,通过运行或执行存储在存储器130内的软件程序/或模块,以及调用存储在存储器130内的数据,执行服务器100的各种功能和处理数据。可选地,处理器110可以包括一个或多个处理单元。
存储器130可用于存储软件程序以及模块,处理器110通过运行存储在存储器130的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器 130可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据业务处理所创建的数据等。此外,存储器130可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
需要说明的是,上述图1所示的结构仅是一种示例,本发明实施例对此不做限定。
基于上述描述,图2示例性的示出了本发明实施例提供的一种景区客流预测的方法的流程,该流程可以由景区客流预测的装置执行,该装置可以位于如图1所示服务器100内,也可以是该服务器100。
如图2所示,该流程具体包括:
步骤201,获取预测景区的参数信息。
步骤202,根据所述参数信息,确定所述预测景区的特征工程。
步骤203,将所述预测景区的特征工程输入至客流预测模型中,预测所述预测景区的客流。
在本发明实施例中,预测景区的参数信息可以为预测景区的特征,例如可以是日期、天气、温度、活动等信息。
在进行景区客流预测之前,需要先训练客流预测模型,该客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,该客流预测模型包括初级训练模型和次级训练模型。具体的,需要先获取景区的历史客流信息,然后在多个场景下按照预测粒度对历史客流进行分析,确定出特征集。针对特征集中每个特征,确定出每个特征对应的特征值,组成第一特征工程,最后,对第一特征工程及其对应的历史客流进行模型训练,确定出客流预测模型。
因而,需要先构建特征工程,本发明实施例中,特征工程构建可以分为场景划分、粒度选择、特征选择三个步骤:
1)场景划分
在某些特殊场景下,客流量数据会产生很大变动,因此可根据景区实际情况对景区客流预测进行a种场景划分A1、A2……Aa,见图1。例A1普通日期客流预测,A2节假日客流预测,A3重大活动日客流预测。
2)粒度选择
情况划分多场景下客流预测以外,还可以根据实际需求划分为b个预测粒度,L1小时、L2天、L3月…Lb,如图3所示。
3)特征选择
通过对景区实地考察,结合划分的场景,选择需要的预测粒度,对景区历史客流数据分析,抓取可对景区客流量造成影响的特征集[XM],针对每个特征进行分析,抽取适合的特征值组成特征工程[XMN],如图3所示。例如在重大活动场景下小时级别的客流预测,部分特征值的抽取如下:
X1日期:从历史客流数据来分析,日期可提取能对客流产生影响的特征值X11month,X12day,X13week,X14hour,……X1N。
X2天气:将天气预报中的天气前后拆分(如阴转多云),给各类型天气赋予权重值以体现天气的好坏,从而得到天气预报中特征值X21前面天气 front(weather)、X22后面天气back(weather)、X23前面天气的权重值 front_weather(weight)、X24后面天气的权重值back_weather(weight)。
X3温度:将天气预报中的温度前后拆分(如15~20℃),再求当天平均温度,从而得到特征值X31最高温度max(C)、X32最低温度min(C)、X33平均温度 mean(C)。
X4活动:将活动按活动规模级别定义,可得到特征值X41如小型活动(1)、 X42中型活动(2)、X43大型活动(3)等,以相应数值对应各种活动规模级别。
通过上述方式得到第一特征工程后,就可以第一特征工程及其对应的历史客流组成数据集,并将数据集分为初级训练数据和次级训练数据。然后使用多种基础算法对初级训练数据进行训练得到多个训练完成的基模型。最后根据次级训练数据和多个训练完成的基模型,进行次级训练,得到客流预测模型。在进行次级训练时,具体可以为将次级训练数据分为训练集和验证集。将训练集分别输入至多个训练完成的模型,得到多个预测值。将多个预测值输入至线性回归模型进行次级训练,得到次级训练模型。使用验证集对次级训练模型进行评估,得到客流预测模型。进一步的,可以根据验证集使用R2误差法对次级训练模型进行评估,若评估值低于预期值,则重新确定第一特征工程,再进行模型训练,直到评估值大于等于预期值为止,得到最终的客流预测模型。
举例来说,本发明实施例是基于stacking集成学习算法进行构建,该算法模型由多个基模型[C1,C2,……Cm]组合训练而得。首先将构建好的特征工程 [XMN]及对应的实际客流量组成数据集,再将此数据集分为初级训练数据和次级训练数据,然后分别基于初级训练数据、次级训练数据进行初级训练和次级训练,最终得到客流预测模型,如图4所示。下面将详细介绍初级训练方法和次级训练方法。
第一、初级训练方法:
在初级训练过程中,预先选择m种基础算法,使用初级训练数据分别对选择的每种算法进行模型训练,得到m个训练完成的基础算法模型,如图5所示。
第二、次级训练方法:
初级训练完成基础模型确认后,将次级训练数据作为训练集分别调用每种基模型进行预测得到预测值Pm,然后把所有预测值组合成一个新的训练集[Pm]。选择线性回归算法作为次级算法模型,将[Pm]作为输入进行线性回归算法模型训练,最后训练得到次级模型与基模型的组合即为最终的预测算法模型。
在次级训练过程中,可将次级训练数据分成训练集和验证集,训练集作为输入对模型进行训练,验证集在模型训练完成后使用R2误差法对模型进行评估,若评估值低于预期值,则需要进行特征工程重构,再重新进行模型的训练,直到评估值达到预期要求,如图6所示。
为了更好的解释本发明实施例提供的景区客流预测的流程,下面将在具体实施场景下进行描述。
2018年11月14日(天气:晴转多云,温度:15~20℃)某景区将举行大型活动,对该天做客流预测,可按如下步骤进行:
1、特征工程构建,根据算法模型训练时的特征工程的结构进行特征工程的构建,以此作为算法模型的输入值。假设在算法模型训练时构建的特征工程是[月,天,周几,前天气,前天气权重,后天气,后天气权重,最低温,最高温,平均温度, 活动],在数据库中定义天气晴(数值:1,权重:0),多云(数值2,权重: 0.2),大型活动(数值:3),则预测时特征工程构建[11,14,3,1,0,2,0.2,15,20,17.5,3]。
2、初级模型预测,假设在初级模型训练时选择的基础模型为Ridge回归算法模型、Lasso回归算法模型、随机森林算法模型、决策树算法模型、XGBoost 算法模型,以第1步中的特征工程作为输入值分别调用这几个模型进行预测,并将输出值组成特征[P1,P2,P3,P4,P5]。
3、次级模型预测,此预测结果为最终的客流预测值。将第2步中最后得到的特征[P1,P2,P3,P4,P5]作为输入调用次级训练中的得到的线性回归算法模型进行预测,此模型的输出值即为最终的客流预测值。
本发明实施例的优点在于利用历史客流数据训练预测模型,然后使用预测模型对未来的客流量进行预测,又可根据不同的场景训练出合适的预测模型,满足复杂环境下的景区客流预测。具有的主要效果如下:
1、依赖于景区历史客流数据,获取容易,对景区硬件设施没有很高的要求;
2、使用灵活,准确性高。
上述实施例表明,获取预测景区的参数信息,根据参数信息,确定预测景区的特征工程,将预测景区的特征工程输入至客流预测模型中,预测预测景区的客流,其中,客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,客流预测模型包括初级训练模型和次级训练模型。通过将特征工程数值至依据初级训练模型和次级训练模型学习得到的客流预测模型中,能够准确的预测到景区的客流,提高了预测准确性。
基于相同的技术构思,图7示例性的示出了本发明实施例提供的一种景区客流预测的装置的结构,该装置可以执行景区客流预测的流程,该装置可以位于图1所示的服务器100内,也可以是该服务器100。
如图7所示,该装置具体包括:
获取单元701,用于获取预测景区的参数信息;
处理单元702,用于根据所述参数信息,确定所述预测景区的特征工程;
将所述预测景区的特征工程输入至客流预测模型中,预测所述预测景区的客流,其中,所述客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,所述客流预测模型包括初级训练模型和次级训练模型。
可选的,所述处理单元702具体用于:
获取景区的历史客流信息;
在多个场景下按照预测粒度对所述历史客流进行分析,确定出特征集;
针对所述特征集中每个特征,确定出每个特征对应的特征值,组成第一特征工程;
对所述第一特征工程及其对应的历史客流进行模型训练,确定出所述客流预测模型。
可选的,所述处理单元702具体用于:
将所述第一特征工程及其对应的历史客流组成数据集;并将所述数据集分为初级训练数据和次级训练数据;
使用多种基础算法对所述初级训练数据进行训练得到多个训练完成的基模型;
根据所述次级训练数据和所述多个训练完成的基模型,进行次级训练,得到所述客流预测模型。
可选的,所述处理单元702具体用于:
将所述次级训练数据分为训练集和验证集;
将所述训练集分别输入至所述多个训练完成的模型,得到多个预测值;
将所述多个预测值输入至线性回归模型进行次级训练,得到次级训练模型;
使用所述验证集对所述次级训练模型进行评估,得到所述客流预测模型。
可选的,所述处理单元702具体用于:
根据所述验证集使用R2误差法对所述次级训练模型进行评估,若评估值低于预期值,则重新确定所述第一特征工程,再进行模型训练,直到所述评估值大于等于预期值为止,得到所述客流预测模型。
基于相同的技术构思,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述景区客流预测的方法。
基于相同的技术构思,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述景区客流预测的方法。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种景区客流预测的方法,其特征在于,包括:
获取预测景区的参数信息;
根据所述参数信息,确定所述预测景区的特征工程;
将所述预测景区的特征工程输入至客流预测模型中,预测所述预测景区的客流,其中,所述客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,所述客流预测模型包括初级训练模型和次级训练模型。
2.如权利要求1所述的方法,其特征在于,所述对景区的不同场景下的客流进行训练学习得到所述客流预测模型,包括:
获取景区的历史客流信息;
在多个场景下按照预测粒度对所述历史客流进行分析,确定出特征集;
针对所述特征集中每个特征,确定出每个特征对应的特征值,组成第一特征工程;
对所述第一特征工程及其对应的历史客流进行模型训练,确定出所述客流预测模型。
3.如权利要求2所述的方法,其特征在于,所述对所述第一特征工程及其对应的历史客流进行模型训练,确定出所述客流预测模型,包括:
将所述第一特征工程及其对应的历史客流组成数据集;并将所述数据集分为初级训练数据和次级训练数据;
使用多种基础算法对所述初级训练数据进行训练得到多个训练完成的基模型;
根据所述次级训练数据和所述多个训练完成的基模型,进行次级训练,得到所述客流预测模型。
4.如权利要求3所述的方法,其特征在于,所述根据所述次级训练数据和所述多个训练完成的基模型,进行次级训练,得到所述客流预测模型,包括:
将所述次级训练数据分为训练集和验证集;
将所述训练集分别输入至所述多个训练完成的模型,得到多个预测值;
将所述多个预测值输入至线性回归模型进行次级训练,得到次级训练模型;
使用所述验证集对所述次级训练模型进行评估,得到所述客流预测模型。
5.如权利要求4所述的方法,其特征在于,所述使用所述验证集对所述次级训练模型进行评估,得到所述客流预测模型,包括:
根据所述验证集使用R2误差法对所述次级训练模型进行评估,若评估值低于预期值,则重新确定所述第一特征工程,再进行模型训练,直到所述评估值大于等于预期值为止,得到所述客流预测模型。
6.一种景区客流预测的装置,其特征在于,包括:
获取单元,用于获取预测景区的参数信息;
处理单元,用于根据所述参数信息,确定所述预测景区的特征工程;
将所述预测景区的特征工程输入至客流预测模型中,预测所述预测景区的客流,其中,所述客流预测模型是对景区的不同场景下的历史客流进行训练学习得到的,所述客流预测模型包括初级训练模型和次级训练模型。
7.如权利要求6所述的装置,其特征在于,所述处理单元具体用于:
获取景区的历史客流信息;
在多个场景下按照预测粒度对所述历史客流进行分析,确定出特征集;
针对所述特征集中每个特征,确定出每个特征对应的特征值,组成第一特征工程;
对所述第一特征工程及其对应的历史客流进行模型训练,确定出所述客流预测模型。
8.如权利要求7所述的装置,其特征在于,所述处理单元具体用于:
将所述第一特征工程及其对应的历史客流组成数据集;并将所述数据集分为初级训练数据和次级训练数据;
使用多种基础算法对所述初级训练数据进行训练得到多个训练完成的基模型;
根据所述次级训练数据和所述多个训练完成的基模型,进行次级训练,得到所述客流预测模型。
9.如权利要求8所述的装置,其特征在于,所述处理单元具体用于:
将所述次级训练数据分为训练集和验证集;
将所述训练集分别输入至所述多个训练完成的模型,得到多个预测值;
将所述多个预测值输入至线性回归模型进行次级训练,得到次级训练模型;
使用所述验证集对所述次级训练模型进行评估,得到所述客流预测模型。
10.如权利要求9所述的装置,其特征在于,所述处理单元具体用于:
根据所述验证集使用R2误差法对所述次级训练模型进行评估,若评估值低于预期值,则重新确定所述第一特征工程,再进行模型训练,直到所述评估值大于等于预期值为止,得到所述客流预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910402126.4A CN111950753A (zh) | 2019-05-15 | 2019-05-15 | 一种景区客流预测的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910402126.4A CN111950753A (zh) | 2019-05-15 | 2019-05-15 | 一种景区客流预测的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111950753A true CN111950753A (zh) | 2020-11-17 |
Family
ID=73336299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910402126.4A Pending CN111950753A (zh) | 2019-05-15 | 2019-05-15 | 一种景区客流预测的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950753A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723716A (zh) * | 2021-11-02 | 2021-11-30 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种客流分级预警异常告警方法、设备及存储介质 |
CN114492987A (zh) * | 2022-01-24 | 2022-05-13 | 浙江大学 | 一种资产存量空间化方法、***及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590569A (zh) * | 2017-09-25 | 2018-01-16 | 山东浪潮云服务信息科技有限公司 | 一种数据预测方法及装置 |
CN107895283A (zh) * | 2017-11-07 | 2018-04-10 | 重庆邮电大学 | 一种基于时间序列分解的商家客流量大数据预测方法 |
CN109034469A (zh) * | 2018-07-20 | 2018-12-18 | 成都中科大旗软件有限公司 | 一种基于机器学习的游客流量预测方法 |
CN109272365A (zh) * | 2018-10-15 | 2019-01-25 | 广东工业大学 | 一种基于数据挖掘的餐厅客流量预测方法、装置及设备 |
-
2019
- 2019-05-15 CN CN201910402126.4A patent/CN111950753A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590569A (zh) * | 2017-09-25 | 2018-01-16 | 山东浪潮云服务信息科技有限公司 | 一种数据预测方法及装置 |
CN107895283A (zh) * | 2017-11-07 | 2018-04-10 | 重庆邮电大学 | 一种基于时间序列分解的商家客流量大数据预测方法 |
CN109034469A (zh) * | 2018-07-20 | 2018-12-18 | 成都中科大旗软件有限公司 | 一种基于机器学习的游客流量预测方法 |
CN109272365A (zh) * | 2018-10-15 | 2019-01-25 | 广东工业大学 | 一种基于数据挖掘的餐厅客流量预测方法、装置及设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723716A (zh) * | 2021-11-02 | 2021-11-30 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种客流分级预警异常告警方法、设备及存储介质 |
CN113723716B (zh) * | 2021-11-02 | 2022-03-18 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种客流分级预警异常告警方法、设备及存储介质 |
CN114492987A (zh) * | 2022-01-24 | 2022-05-13 | 浙江大学 | 一种资产存量空间化方法、***及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10606862B2 (en) | Method and apparatus for data processing in data modeling | |
US20180253637A1 (en) | Churn prediction using static and dynamic features | |
CN111815432B (zh) | 金融服务风险预测方法及装置 | |
CN113435770A (zh) | 基于区块链的交易风险评估方法及装置 | |
CN110415036B (zh) | 用户等级的确定方法、装置、计算机设备和存储介质 | |
CN111667093B (zh) | 中长期风电发电计算方法及装置 | |
CN110796366A (zh) | 质差小区识别方法和装置 | |
CN111950622A (zh) | 基于人工智能的行为预测方法、装置、终端及存储介质 | |
CN113408561A (zh) | 模型生成方法、目标检测方法、装置、设备及存储介质 | |
CN108416619B (zh) | 一种消费间隔时间预测方法、装置及可读存储介质 | |
CN111950753A (zh) | 一种景区客流预测的方法及装置 | |
CN115730947A (zh) | 银行客户流失预测方法及装置 | |
CN116205355A (zh) | 电力负荷的预测方法、装置以及存储介质 | |
CN113672375A (zh) | 资源分配预测方法、装置、设备及存储介质 | |
CN115017050A (zh) | 自动驾驶的测试场景生成***及方法 | |
CN111210158A (zh) | 目标地址确定方法、装置、计算机设备和存储介质 | |
US9626156B2 (en) | Application architecture design method, application architecture design system, and recording medium | |
CN111090401B (zh) | 存储设备性能预测方法及装置 | |
CN113827978A (zh) | 一种流失用户预测方法、装置及计算机可读存储介质 | |
CN112905451A (zh) | 应用程序的自动化测试方法及装置 | |
CN110309948A (zh) | 整车物流订单预测方法及装置、物流***以及计算机可读介质 | |
CN115169705A (zh) | 配送时长预测方法、装置、存储介质及计算机设备 | |
CN111832599B (zh) | 一种基于机器学习随机森林的加油站预测方法 | |
CN112434648A (zh) | 一种墙体形状变化检测方法及*** | |
CN112434653A (zh) | 一种遥感图像建筑区检测方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |