CN109102159A - 旅客评级模型生成方法、装置、计算机设备和存储介质 - Google Patents

旅客评级模型生成方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109102159A
CN109102159A CN201810788417.7A CN201810788417A CN109102159A CN 109102159 A CN109102159 A CN 109102159A CN 201810788417 A CN201810788417 A CN 201810788417A CN 109102159 A CN109102159 A CN 109102159A
Authority
CN
China
Prior art keywords
rating model
standard
place
passenger
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810788417.7A
Other languages
English (en)
Other versions
CN109102159B (zh
Inventor
孙闳绅
金戈
徐亮
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810788417.7A priority Critical patent/CN109102159B/zh
Priority to PCT/CN2018/106083 priority patent/WO2020015140A1/zh
Publication of CN109102159A publication Critical patent/CN109102159A/zh
Application granted granted Critical
Publication of CN109102159B publication Critical patent/CN109102159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种旅客评级模型生成方法、装置、计算机设备和存储介质。所述方法包括:获取历史过关记录,所述历史过关记录携带有风险旅客标签或普通旅客标签;将所述历史过关记录按照过关地点进行分组;对分组后的历史过关记录分别进行训练得到对应的地点评级模型;将所得到的地点评级模型进行组合得到旅客评级模型。采用本方法能够提高评级准确性。

Description

旅客评级模型生成方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种旅客评级模型生成方法、装置、计算机设备和存储介质。
背景技术
机场、口岸等出入境场所每天都会大量旅客过关,其中不乏一些走私、偷渡等不法分子。目前安防场景中有大量人员通行记录,在通行人群中有少部分人员具有高风险。
然而,目前安防人员仅能够凭经验对过关旅客进行抽查,或运用简单规则对大量数据进行初步筛选,这两种方法均不能够准确地对过关旅客进行评级。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高评级准确性的旅客评级模型生成方法、装置、计算机设备和存储介质。
一种旅客评级模型生成方法,所述方法包括:
获取历史过关记录,所述历史过关记录携带有风险旅客标签或普通旅客标签;
将所述历史过关记录按照过关地点进行分组;
对分组后的历史过关记录分别进行训练得到对应的地点评级模型;
将所得到的地点评级模型进行组合得到旅客评级模型。
在其中一个实施例中,所述将所得到的地点评级模型进行组合得到旅客评级模型,包括:
接收输入的针对所述地点评级模型的权重分配指令;
根据所述权重分配指令得到所述地点评级模型的权重;
按照加权平均的方式根据所述地点评级模型以及对应的权重计算得到旅客评级模型。
在其中一个实施例中,所述对分组后的历史过关记录进行训练得到对应的地点评级模型,包括:
获取当前业务规则,并查询与所述当前业务规则对应的补充特征参数;
分别根据分组后的所述第一过关记录中的原始特征参数计算补充特征参数;
对所述补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
在其中一个实施例中,所述对分组后的历史过关记录进行训练得到对应的地点评级模型,包括:
将分组后的所述历史过关记录划分为训练集数据和测试集数据;
从所述训练集数据中提取第一特征参数,根据所述第一特征参数进行特征增益评估,并根据特征增益评估结果从所述第一特征参数中提取目标特征;
根据所提取的目标特征以及对应的所述训练集数据对应的旅客标签对所述训练集数据进行分类得到初始评级模型,并计算所述初始评级模型中各个分类节点的评分等级;
从所述测试集数据中提取与所选择的目标特征对应的第二特征参数;
通过所述第二特征参数以及所述测试集数据对应的旅客标签对所述初始评级模型中各个节点的评分等级进行验证得到第一验证结果;
根据所述第一验证结果对所述初始评级模型进行调整得到地点评级模型。
在其中一个实施例中,所述方法还包括:
当到达历史过关记录更新时间时,加载更新的历史过关记录;
从更新的所述历史过关记录中提取与所述地点评级模型对应的第三特征参数;
根据所述第三特征参数和更新的所述历史过关记录对应的旅客标签对所述地点评级模型中各节点的评分等级进行验证得到第二验证结果;
根据所述第二验证结果对所述地点评级模型进行优化。
一种旅客评级模型生成装置,所述装置包括:
历史过关记录获取模块,用于获取历史过关记录,所述历史过关记录携带有风险旅客标签或普通旅客标签;
分组模块,用于将所述历史过关记录按照过关地点进行分组;
地点评级模型生成模块,用于对分组后的历史过关记录分别进行训练得到对应的地点评级模型;
旅客评级模型生成模块,用于将所得到的地点评级模型进行组合得到旅客评级模型。
在其中一个实施例中,所述旅客评级模型生成模块包括:
接收单元,用于接收输入的针对所述地点评级模型的权重分配指令;
权重获取单元,用于根据所述权重分配指令得到所述地点评级模型的权重;
第一计算单元,用于按照加权平均的方式根据所述地点评级模型以及对应的权重计算得到旅客评级模型。
在其中一个实施例中,所述地点评级模型生成模块包括:
业务规则获取单元,用于获取当前业务规则,并查询与所述当前业务规则对应的补充特征参数;
第二计算单元,用于分别根据分组后的所述第一过关记录中的原始特征参数计算补充特征参数;
地点评级模型生成单元,用于对所述补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
上述旅客评级模型生成方法、装置、计算机设备和存储介质,对历史过关记录按照过关地点进行分组,并根据过关地点的不同分别生成对应的地点评级模型,最后将地点评级模型进行组合得到了旅客评级模型,使得旅客评级模型涉及范围广,从而可以提高旅客评级的准确性。
附图说明
图1为一个实施例中旅客评级模型生成方法的应用场景图;
图2为一个实施例中旅客评级模型生成方法的流程示意图;
图3为一个实施例中旅客评级模型生成装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的旅客评级模型生成方法,可以应用于如图1所示的应用环境中。其中,服务器102通过网络与数据库104进行通信。服务器102可以从数据库104中读取历史过关记录,该历史过关记录中携带有风险旅标签或普通旅客标签,服务器首先将历史过关记录按照过关地点进行分组,然后将分组后的历史过关记录分别进行训练得到对应的地点评级模型;最后将所得到的地点评级模型进行组合得到旅客评级模型,使得旅客评级模型涉及范围广,从而可以提高旅客评级的准确性。其中,服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种旅客评级模型生成方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202:获取历史过关记录,历史过关记录携带有风险旅客标签或普通旅客标签。
具体地,历史过关记录是以往旅客通关时所产生的记录,该过关记录中包含了若干基本字段,包括姓名、年龄、性别以及通关时间等,该过关记录可以包括未被检查的旅客的过关记录以及被检查的旅客的过关记录,被检查的旅客的过关记录对应的是被检查旅客是否为风险旅客的记录,其中,为了方便,未被检查的旅客以及被检查的且检查结果为普通的旅客对应的过关记录携带有普通旅客标签,被检查的且检查结果为风险旅客对应的过关记录携带有风险旅客标签。
其中服务器可以从数据库中获取全部的历史过关记录,或者为了方便,服务器本地还可以缓存有部分历史过关记录,从而方便模型训练。
S204:将历史过关记录按照过关地点进行分组。
具体地,由于数据库中存储了大量的历史过关记录,因此为了方便可以将历史过关记录按照过关地点进行分组。例如服务器可以首先检测历史过关记录的过关地点字段,然后通过该过关地点字段对所获取的历史过关记录进行分组。
S206:对分组后的历史过关记录分别进行训练得到对应的地点评级模型。
具体地,在对历史过关记录按照就过关地点进行分组后,可以对分组后的历史过关记录分别进行训练得到过关地点对应的地点评级模型。且每一个地点评级模型均是采用决策树模型得到的,且可以预测旅客在过关地点的风险等级。
S208:将所得到的地点评级模型进行组合得到旅客评级模型。
具体地,服务器在训练得到地点评级模型后,对训练得到的地点评级模型进行组合得到旅客评级模型,例如可以给不同的地点评级模型分配不同的权值,然后根据权值以及不同的地点评级模型得到旅客评级模型,其中所分配的权值可以是根据各个地点评级模型对应的过关历史记录中具有风险旅客标签的过关历史记录的比例的大小进行配置的,例如当某一过关地点对应的上述比例较大时,则其权值变大。可选地,服务器可以获取到各个过关地点对应的比例,然后将该些比例进行归一化作为最后的权值。
上述旅客评级模型生成方法,对历史过关记录按照过关地点进行分组,并根据过关地点的不同分别生成对应的地点评级模型,最后将地点评级模型进行组合得到了旅客评级模型,使得旅客评级模型涉及范围广,从而可以提高旅客评级的准确性。
在其中一个实施例中,将所得到的地点评级模型进行组合得到旅客评级模型,可以包括:接收输入的针对地点评级模型的权重分配指令;根据权重分配指令得到地点评级模型的权重;按照加权平均的方式根据地点评级模型以及对应的权重计算得到旅客评级模型。
在其中一个实施例中,对分组后的历史过关记录进行训练得到对应的地点评级模型,可以包括:获取当前业务规则,并查询与当前业务规则对应的补充特征参数;分别根据分组后的第一过关记录中的原始特征参数计算补充特征参数;对补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
具体地,将所得到的地点评级模型进行组合得到旅客评级模型的可以是由用户进行干预的,例如服务器可以将各个地点评级模型输出,并显示各个地点评级模型对应的过关地点,用户可以根据实际需要对各个地点评级模型分配对应的权重,例如,如果过关地点是第一地点,则用户可以将第一地点对应的地点评级模型的权重对应地设置较大,并将与第一地点关联的第二地点的地点评级模型的权重对应地设置较大,而将其他地点评级模型的权重对应地设置较少。其中与第一地点关联的第二地点可以是与第一地点存在业务联系的第二地点。
服务器在接收到用户输入的地点评级模型对应的权重后,则按照加权平均的方式根据地点评级模型以及对应的权重计算得到旅客评级模型。如A(旅客评级模型)=(A1*a1+A2*a2+A3*a3+……+AN*an)/N,其中A1、A2……AN是指模型,a1、a2……an是指权重。
具体地,上述的地点评级模型生成之前,可以获取到当前业务规则,并查询当前业务规则对应的补充特征参数,从而可以根据分组后的第一过关记录中的原始特征参数计算补充特征参数。其中当前业务规则包括通行特征、检查类特征、过关信息类特征、频率静态特征、频率动态特征;从而所生成的补充特征参数可以包括:同行类补充特征参数:30个,如“15天前,7天内同行次数”,“15天之前,30天内平均每人同行次数”等。检查类补充特征参数:20个,如“30天前,30天内命中数”,“30天之前,最近一次通关和查验时间的间隔天数”等。过关信息类补充特征参数:23个,如“15天之前,最近一次通关时间”,“30天之前,30天内关口数”等。频率类静态补充特征参数:14个,如“15天之前,30天内通关次数”,“30天之前,7天内通关天数”等。频率类动态补充特征参数:34个,如“15天之前,90天内第一次和第五次最小间隔时间”,“30天之前,30天内第一次和第五次间隔时间平均值”等。
可选地,当服务器获取到的当前业务规则是同行规则时,则通过关记录中获取到不同旅客在预设天数内的同行次数,将给同行次数特征作为补充特征参数。同样地,过关信息类特征、频率类静态特征以及频率动态类特征也采用同样的方式,根据业务规则生成对应的逻辑。
服务器在生成补充特征参数后,将补充特征参数以及原始特征参数进行训练得到地点评级模型,可选地,服务器可以将补充特征参数以及原始特征参数进行组合进行训练得到若干地点评级模型,且将验证历史过关记录输入至所生成的若干地点评级模型中得到旅客的风险等级,并与历史过关记录中的风险等级进行比较,获取所生成的若干地点评级模型对应的成功率,该成功率=地点评级模型中得到旅客的风险等级与历史过关记录中的风险等级相同的历史过关记录的数量/验证历史过关记录,服务器选取成功率最大的地点评级模型作为该过关地点的地点评级模型,并将成功率最大的地点评级模型对应的特征作为训练特征。
上述实施例中,在训练地点评级模型前,首先根据历史过关记录生成了多个补充特征参数,从而使得生成的地点评级模型更加准确。且用户可以根据需要来配置各个地点评级模型的权重,从而使得所生成的旅客评级模型涉及范围广,从而可以提高旅客评级的准确性。
在其中一个实施例中,对分组后的历史过关记录进行训练得到对应的地点评级模型,可以包括:将分组后的历史过关记录划分为训练集数据和测试集数据;从训练集数据中提取第一特征参数,根据第一特征参数进行特征增益评估,并根据特征增益评估结果从第一特征参数中提取目标特征;根据所提取的目标特征以及对应的训练集数据对应的旅客标签对训练集数据进行分类得到初始评级模型,并计算初始评级模型中各个分类节点的评分等级;从测试集数据中提取与所选择的目标特征对应的第二特征参数;通过第二特征参数以及测试集数据对应的旅客标签对初始评级模型中各个节点的评分等级进行验证得到第一验证结果;根据第一验证结果对初始评级模型进行调整得到地点评级模型。
在其中一个实施例中,上述旅客评级模型生成方法还可以包括:当到达历史过关记录更新时间时,加载更新的历史过关记录;从更新的历史过关记录中提取与地点评级模型对应的第三特征参数;根据第三特征参数和更新的历史过关记录对应的旅客标签对地点评级模型中各节点的评分等级进行验证得到第二验证结果;根据第二验证结果对地点评级模型进行优化。
具体地,在本实施例中以A过关地点为例进行说明,其中将A过关地点对应的历史过关记录划分为训练集数据和测试集数据,从训练集数据中提取出第一特征参数和第一目标类别(对应旅客评分等级);根据第一特征参数进行特征信息增益评估,根据特征信息评估结果进行特征选择,即选择目标特征,然后所提取的目标特征以及对应的训练集数据对应的旅客标签对训练集数据进行分类得到初始评级模型,并计算初始决策树评估模型中各节点的评分等级;从测试集数据中提取出第二特征参数和第二目标类别;根据第二特征参数和第二目标类别对初始决策评估模型中各节点的评分等级进行验证;根据第一验证结果对初始评级模型中的决策树结构进行优化调整并生成地点评级模型。在本实施例中的第一特征参数和第二特征参数为与上述实施例中所提到的补充特征参数和原始特征参数,目标类别分为多类,即旅客的评分等级,该样本数据的评分等级是预先已经知道的。
决策树是一种由节点和有向边组成的、用于对实例进行分类的树形结构。节点的类型有两种:内部节点和叶子节点。其中,内部节点表示特征或属性的测试条件,叶子节点表示分类。使用决策树模型进行分类的具体方法是:从根节点开始,对实例的某一特征进行测试,根据测试结果将实例分配到其子节点。沿该分支可能达到叶子节点或者到达另一个内部节点时,则使用新的测试条件递归执行下去,直到抵达一个叶子节点。当到达叶子节点时,则得到最终分类结果。
在本实施例中决策树模型采用ID3算法,基于越是小型的决策树越优于大的决策树的原则,根据信息增益评估和选择特征,每次选择信息增益最大的特征作为判断条件建立子结点。信息增益表示得知特征X的信息而使得类Y的信息的不确定性减少的程度。特征A对训练数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差,即
g(D,A)=H(D)-H(D|A) (I)
其中,g(D,A)为特征A对训练数据集D的信息增益,H(D)为训练数据集D的经验熵,H(D|A)为特征A对数据集D的经验条件熵。
根据信息增益准则的特征选择方法是:对训练数据集(或子集)计算其每个特征的信息增益,选择信息增益最大的特征。计算信息增益的算法如下:其输入为训练数据集D和特征A,输出为特征A对训练数据集D的信息增益g(D,A)。
首先,计算数据集D的经验熵H(D):
其中,Ck为第一目标类别对应的样本数量,K为第一目标类别的类别数量,在本实施例中,第一目标类别分为旅客的各个评分等级。
其次,计算特征A对数据集D的经验条件熵H(D|A):
其中,value(A)是特征A所有的取值集合,i是特征A的一个取值,Di是训练数据集D中特征A取值为i的样例集合,|Di|表示取值为i的样例集合的样本数量,|D|表示进行样例集合划分前样本的总数量,如性别特征参数对应的特征A所有的取值为男和女,如男可以用0表示,女可以用1表示,value(A)为(0,1)。
第三,计算信息增益:
g(D,A)=H(D)-H(D|A) (1)
服务器从测试集数据的各个样本中逐个提取出第二特征参数和第二目标类别。其中,第二特征参数与上述的第一特征参数的类别相同,可选地,可以是所选择的信息增益最大的特征,即上述目标特征,在此不再赘述。第二目标类别为安全检查结果的类别,第二目标类别为旅客评分等级。
通过测试集数据在对预设规则模型进行验证时,若验证结果的偏差过大时,可以对所选取的特征参数进行调整,如将统计量进行调整等,重新构建预设规则模型的决策树并进行验证直至第一验证结果在误差范围内,也可以从根节点开始对分支节点的特征选择进行调整,对决策树进行优化,在调整时,可以采用增加训练集的数据量等方式,直至优化的决策树的第一验证结果可以在误差范围内。
且根据特征信息评估结果获取到区分程度最大的特征(字段)可以包括计算第一特征参数对应的各特征参数的信息增益;选取信息增益最大的特征作为判断条件建立子节点;根据子节点对应的训练集数据划分为子集数据,对子集数据以递归方式进行分支直至所有分支节点对应的数据对应于相同的目标类别。通过将训练记录相继划分成较纯的子集,以递归方式建立决策树。设Dt是与节点t相关联的训练记录集,而y={y1,y2,…,yc}y={y1,y2,…,yc}是类标号,Hunt算法的递归定义如下:如果Dt中所有记录都属于同一个类,则t是叶节点,用yt标记。如果Dt中包含属于多个类的记录,则选择一个属性测试条件(attribute test condition),将记录划分成较小的子集。对于测试条件的每个输出,创建一个子女节点,并根据测试结果将Dt中的记录分布到子女节点中。然后,对于每个子女节点,递归地调用该算法。
服务器根据测试数据集中各样本的第二特征参数和第二目标类别,从测试数据集中统计出与预设规则模型中各分类节点对应的特征参数组合匹配的负样本数据,计算统计的负样本数据在测试数据集中总的负样本数据中所占的比例,并根据计算出的比例对决策树进行验证。在验证时,服务器可以设定预设容错误差,当所计算出的绝对差值小于预设容错误差时,验证通过,当所计算出的绝对差值大于预设容错误差时,验证不通过。当验证不通过时,服务器可以将测试数据集中的样本数据加入训练数据集中,扩大样本容量对预设规则模型进行训练,对预设规则模型进行调整。
在其中一个实施例中,在上述根据决策树模型生成地点评级模型后,服务器根据地点评级模型再生成旅客评级模型,从而可以使用该旅客评级模型,但可选地为了保证旅客评级模型的正确性,服务器可以预先设定历史过关记录更新时间,历史过关记录更新时间可以为对安防场所的过关记录进行更新的时间。当到达历史过关记录更新时间后,服务器加载更新的历史过关记录,历史过关记录包含了若干基本字段,包括姓名、年龄、性别以及通关时间等,安防终端可以主动或被动地向服务器发送更新的历史过关记录。
服务器从历史过关记录中提取出第三特征参数和旅客风险等级,第三特征参数与生成旅客评级模型的地点评级模型中设定的特征相对应,即与目标特征相对应,旅客风险等级即为安全检查结果标记。
服务器根据历史过关记录中的第三特征参数和旅客风险等级,从历史过关记录中统计出与各个地点评级模型中各分类节点对应的特征参数组合匹配的负样本数据,计算统计的负样本数据在历史过关记录总的负样本数据中所占的比例,并根据计算出的比例对各个地点评级模型中各分类节点的旅客等级进行验证。在验证时,服务器可以设定预设偏差,当计算出的比例与旅客等级中该等级的负样本占比的绝对差值小于预设偏差时,验证通过;当计算出的比例与旅客等级中该等级的负样本占比的绝对差值大于预设偏差时,验证不通过。当验证不通过时,服务器可以将历史过关记录继续对旅客评分模型进行训练和调整,从而根据历史过关记录对地点评级模型进行不断优化,进一步对旅客评级模型进行优化,从而通过大数据的训练使得通过旅客评级模型得到的旅客等级越来越准确。
上述实施例中,通过决策树模型来生成地点评级模型,提高了准确性。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种旅客评级模型生成装置,包括:历史过关记录获取模块100、分组模块200、地点评级模型生成模块300和旅客评级模型生成模块400,其中:
历史过关记录获取模块100,用于获取历史过关记录,历史过关记录携带有风险旅客标签或普通旅客标签。
分组模块200,用于将历史过关记录按照过关地点进行分组。
地点评级模型生成模块300,用于对分组后的历史过关记录分别进行训练得到对应的地点评级模型。
旅客评级模型生成模块400,用于将所得到的地点评级模型进行组合得到旅客评级模型。
在其中一个实施例中,旅客评级模型生成模块400包括:
接收单元,用于接收输入的针对地点评级模型的权重分配指令。
权重获取单元,用于根据权重分配指令得到地点评级模型的权重。
第一计算单元,用于按照加权平均的方式根据地点评级模型以及对应的权重计算得到旅客评级模型。
在其中一个实施例中,地点评级模型生成模块300包括:
业务规则获取单元,用于获取当前业务规则,并查询与当前业务规则对应的补充特征参数。
第二计算单元,用于分别根据分组后的第一过关记录中的原始特征参数计算补充特征参数。
地点评级模型生成单元,用于对补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
在其中一个实施例中,地点评级模型生成模块300包括:
划分单元,用于将分组后的历史过关记录划分为训练集数据和测试集数据。
目标特征提取单元,用于从训练集数据中提取第一特征参数,根据第一特征参数进行特征增益评估,并根据特征增益评估结果从第一特征参数中提取目标特征。
初始评级模型生成单元,用于根据所提取的目标特征以及对应的训练集数据对应的旅客标签对训练集数据进行分类得到初始评级模型,并计算初始评级模型中各个分类节点的评分等级。
特征提取单元,用于从测试集数据中提取与所选择的目标特征对应的第二特征参数。
验证单元,用于通过第二特征参数以及测试集数据对应的旅客标签对初始评级模型中各个节点的评分等级进行验证得到第一验证结果。
调整单元,用于根据第一验证结果对初始评级模型进行调整得到地点评级模型。
在其中一个实施例中,装置还包括:
加载模块,用于当到达历史过关记录更新时间时,加载更新的历史过关记录。
特征提取模块,用于从更新的历史过关记录中提取与地点评级模型对应的第三特征参数。
验证模块,用于根据第三特征参数和更新的历史过关记录对应的旅客标签对地点评级模型中各节点的评分等级进行验证得到第二验证结果。
优化模块,用于根据第二验证结果对地点评级模型进行优化。
关于旅客评级模型生成装置的具体限定可以参见上文中对于旅客评级模型生成方法的限定,在此不再赘述。上述旅客评级模型生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史过关记录。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种旅客评级模型生成方法。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取历史过关记录,历史过关记录携带有风险旅客标签或普通旅客标签;将历史过关记录按照过关地点进行分组;对分组后的历史过关记录分别进行训练得到对应的地点评级模型;将所得到的地点评级模型进行组合得到旅客评级模型。
在一个实施例中,处理器执行计算机程序时所实现的将所得到的地点评级模型进行组合得到旅客评级模型,可以包括:接收输入的针对地点评级模型的权重分配指令;根据权重分配指令得到地点评级模型的权重;按照加权平均的方式根据地点评级模型以及对应的权重计算得到旅客评级模型。
在一个实施例中,处理器执行计算机程序时所实现的对分组后的历史过关记录进行训练得到对应的地点评级模型,可以包括:获取当前业务规则,并查询与当前业务规则对应的补充特征参数;分别根据分组后的第一过关记录中的原始特征参数计算补充特征参数;对补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
在一个实施例中,处理器执行计算机程序时所实现的对分组后的历史过关记录进行训练得到对应的地点评级模型,可以包括:将分组后的历史过关记录划分为训练集数据和测试集数据;从训练集数据中提取第一特征参数,根据第一特征参数进行特征增益评估,并根据特征增益评估结果从第一特征参数中提取目标特征;根据所提取的目标特征以及对应的训练集数据对应的旅客标签对训练集数据进行分类得到初始评级模型,并计算初始评级模型中各个分类节点的评分等级;从测试集数据中提取与所选择的目标特征对应的第二特征参数;通过第二特征参数以及测试集数据对应的旅客标签对初始评级模型中各个节点的评分等级进行验证得到第一验证结果;根据第一验证结果对初始评级模型进行调整得到地点评级模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当到达历史过关记录更新时间时,加载更新的历史过关记录;从更新的历史过关记录中提取与地点评级模型对应的第三特征参数;根据第三特征参数和更新的历史过关记录对应的旅客标签对地点评级模型中各节点的评分等级进行验证得到第二验证结果;根据第二验证结果对地点评级模型进行优化。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取历史过关记录,历史过关记录携带有风险旅客标签或普通旅客标签;将历史过关记录按照过关地点进行分组;对分组后的历史过关记录分别进行训练得到对应的地点评级模型;将所得到的地点评级模型进行组合得到旅客评级模型。
在一个实施例中,计算机程序被处理器执行时所实现的将所得到的地点评级模型进行组合得到旅客评级模型,可以包括:接收输入的针对地点评级模型的权重分配指令;根据权重分配指令得到地点评级模型的权重;按照加权平均的方式根据地点评级模型以及对应的权重计算得到旅客评级模型。
在一个实施例中,计算机程序被处理器执行时所实现的对分组后的历史过关记录进行训练得到对应的地点评级模型,可以包括:获取当前业务规则,并查询与当前业务规则对应的补充特征参数;分别根据分组后的第一过关记录中的原始特征参数计算补充特征参数;对补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
在一个实施例中,计算机程序被处理器执行时所实现的对分组后的历史过关记录进行训练得到对应的地点评级模型,可以包括:将分组后的历史过关记录划分为训练集数据和测试集数据;从训练集数据中提取第一特征参数,根据第一特征参数进行特征增益评估,并根据特征增益评估结果从第一特征参数中提取目标特征;根据所提取的目标特征以及对应的训练集数据对应的旅客标签对训练集数据进行分类得到初始评级模型,并计算初始评级模型中各个分类节点的评分等级;从测试集数据中提取与所选择的目标特征对应的第二特征参数;通过第二特征参数以及测试集数据对应的旅客标签对初始评级模型中各个节点的评分等级进行验证得到第一验证结果;根据第一验证结果对初始评级模型进行调整得到地点评级模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当到达历史过关记录更新时间时,加载更新的历史过关记录;从更新的历史过关记录中提取与地点评级模型对应的第三特征参数;根据第三特征参数和更新的历史过关记录对应的旅客标签对地点评级模型中各节点的评分等级进行验证得到第二验证结果;根据第二验证结果对地点评级模型进行优化。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种旅客评级模型生成方法,所述方法包括:
获取历史过关记录,所述历史过关记录携带有风险旅客标签或普通旅客标签;
将所述历史过关记录按照过关地点进行分组;
对分组后的历史过关记录分别进行训练得到对应的地点评级模型;
将所得到的地点评级模型进行组合得到旅客评级模型。
2.根据权利要求1所述的方法,其特征在于,所述将所得到的地点评级模型进行组合得到旅客评级模型,包括:
接收输入的针对所述地点评级模型的权重分配指令;
根据所述权重分配指令得到所述地点评级模型的权重;
按照加权平均的方式根据所述地点评级模型以及对应的权重计算得到旅客评级模型。
3.根据权利要求1所述的方法,其特征在于,所述对分组后的历史过关记录进行训练得到对应的地点评级模型,包括:
获取当前业务规则,并查询与所述当前业务规则对应的补充特征参数;
分别根据分组后的所述第一过关记录中的原始特征参数计算补充特征参数;
对所述补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述对分组后的历史过关记录进行训练得到对应的地点评级模型,包括:
将分组后的所述历史过关记录划分为训练集数据和测试集数据;
从所述训练集数据中提取第一特征参数,根据所述第一特征参数进行特征增益评估,并根据特征增益评估结果从所述第一特征参数中提取目标特征;
根据所提取的目标特征以及对应的所述训练集数据对应的旅客标签对所述训练集数据进行分类得到初始评级模型,并计算所述初始评级模型中各个分类节点的评分等级;
从所述测试集数据中提取与所选择的目标特征对应的第二特征参数;
通过所述第二特征参数以及所述测试集数据对应的旅客标签对所述初始评级模型中各个节点的评分等级进行验证得到第一验证结果;
根据所述第一验证结果对所述初始评级模型进行调整得到地点评级模型。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当到达历史过关记录更新时间时,加载更新的历史过关记录;
从更新的所述历史过关记录中提取与所述地点评级模型对应的第三特征参数;
根据所述第三特征参数和更新的所述历史过关记录对应的旅客标签对所述地点评级模型中各节点的评分等级进行验证得到第二验证结果;
根据所述第二验证结果对所述地点评级模型进行优化。
6.一种旅客评级模型生成装置,其特征在于,所述装置包括:
历史过关记录获取模块,用于获取历史过关记录,所述历史过关记录携带有风险旅客标签或普通旅客标签;
分组模块,用于将所述历史过关记录按照过关地点进行分组;
地点评级模型生成模块,用于对分组后的历史过关记录分别进行训练得到对应的地点评级模型;
旅客评级模型生成模块,用于将所得到的地点评级模型进行组合得到旅客评级模型。
7.根据权利要求6所述的装置,其特征在于,所述旅客评级模型生成模块包括:
接收单元,用于接收输入的针对所述地点评级模型的权重分配指令;
权重获取单元,用于根据所述权重分配指令得到所述地点评级模型的权重;
第一计算单元,用于按照加权平均的方式根据所述地点评级模型以及对应的权重计算得到旅客评级模型。
8.根据权利要求6所述的装置,其特征在于,所述地点评级模型生成模块包括:
业务规则获取单元,用于获取当前业务规则,并查询与所述当前业务规则对应的补充特征参数;
第二计算单元,用于分别根据分组后的所述第一过关记录中的原始特征参数计算补充特征参数;
地点评级模型生成单元,用于对所述补充特征参数以及原始特征参数进行训练得到对应的地点评级模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN201810788417.7A 2018-07-18 2018-07-18 旅客评级模型生成方法、装置、计算机设备和存储介质 Active CN109102159B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810788417.7A CN109102159B (zh) 2018-07-18 2018-07-18 旅客评级模型生成方法、装置、计算机设备和存储介质
PCT/CN2018/106083 WO2020015140A1 (zh) 2018-07-18 2018-09-18 旅客评级模型生成方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810788417.7A CN109102159B (zh) 2018-07-18 2018-07-18 旅客评级模型生成方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109102159A true CN109102159A (zh) 2018-12-28
CN109102159B CN109102159B (zh) 2023-06-20

Family

ID=64846639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810788417.7A Active CN109102159B (zh) 2018-07-18 2018-07-18 旅客评级模型生成方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN109102159B (zh)
WO (1) WO2020015140A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598995A (zh) * 2019-08-15 2019-12-20 中国平安人寿保险股份有限公司 智能客户评级方法、装置及计算机可读存储介质
CN111352171A (zh) * 2020-03-30 2020-06-30 重庆特斯联智慧科技股份有限公司 一种实现人工智能区域屏蔽安检方法和***
CN113052689A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 一种基于决策树的产品推荐方法及装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111831904A (zh) * 2020-06-18 2020-10-27 天讯瑞达通信技术有限公司 一种旅客行为数据分析方法及***
CN115001771B (zh) * 2022-05-25 2024-01-26 武汉极意网络科技有限公司 基于自动更新的验证码防御方法、***、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106030626A (zh) * 2013-12-11 2016-10-12 天巡有限公司 用于提供诸如飞机票价可用性的票价可用性的方法和***
CN106874951A (zh) * 2017-02-14 2017-06-20 Tcl集团股份有限公司 一种旅客关注度评级方法及装置
CN107194412A (zh) * 2017-04-20 2017-09-22 百度在线网络技术(北京)有限公司 一种处理数据的方法、装置、设备和计算机存储介质
CN107590569A (zh) * 2017-09-25 2018-01-16 山东浪潮云服务信息科技有限公司 一种数据预测方法及装置
WO2018090839A1 (zh) * 2016-11-16 2018-05-24 阿里巴巴集团控股有限公司 身份认证***、方法、装置及账号认证方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570631B (zh) * 2016-10-28 2021-01-01 南京邮电大学 一种面向p2p平台运营风险评估的方法和***
CN108269012A (zh) * 2018-01-12 2018-07-10 中国平安人寿保险股份有限公司 风险评分模型的构建方法、装置、存储介质及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106030626A (zh) * 2013-12-11 2016-10-12 天巡有限公司 用于提供诸如飞机票价可用性的票价可用性的方法和***
WO2018090839A1 (zh) * 2016-11-16 2018-05-24 阿里巴巴集团控股有限公司 身份认证***、方法、装置及账号认证方法
CN106874951A (zh) * 2017-02-14 2017-06-20 Tcl集团股份有限公司 一种旅客关注度评级方法及装置
CN107194412A (zh) * 2017-04-20 2017-09-22 百度在线网络技术(北京)有限公司 一种处理数据的方法、装置、设备和计算机存储介质
CN107590569A (zh) * 2017-09-25 2018-01-16 山东浪潮云服务信息科技有限公司 一种数据预测方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598995A (zh) * 2019-08-15 2019-12-20 中国平安人寿保险股份有限公司 智能客户评级方法、装置及计算机可读存储介质
CN110598995B (zh) * 2019-08-15 2023-08-25 中国平安人寿保险股份有限公司 智能客户评级方法、装置及计算机可读存储介质
CN111352171A (zh) * 2020-03-30 2020-06-30 重庆特斯联智慧科技股份有限公司 一种实现人工智能区域屏蔽安检方法和***
CN113052689A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 一种基于决策树的产品推荐方法及装置
CN113052689B (zh) * 2021-04-30 2024-03-26 中国银行股份有限公司 一种基于决策树的产品推荐方法及装置

Also Published As

Publication number Publication date
CN109102159B (zh) 2023-06-20
WO2020015140A1 (zh) 2020-01-23

Similar Documents

Publication Publication Date Title
CN109102159A (zh) 旅客评级模型生成方法、装置、计算机设备和存储介质
CN108564129B (zh) 一种基于生成对抗网络的轨迹数据分类方法
CN108764306A (zh) 图像分类方法、装置、计算机设备和存储介质
CN112989035B (zh) 基于文本分类识别用户意图的方法、装置及存储介质
CN109359939A (zh) 业务数据校验方法、装置、计算机设备和存储介质
CN109063984B (zh) 风险旅客方法、装置、计算机设备和存储介质
CN106503863A (zh) 基于决策树模型的年龄特征的预测方法、***及终端
CN109886554A (zh) 违规行为判别方法、装置、计算机设备和存储介质
CN111797320B (zh) 数据处理方法、装置、设备及存储介质
US20210073669A1 (en) Generating training data for machine-learning models
CN112365007B (zh) 模型参数确定方法、装置、设备及存储介质
CN110069545A (zh) 一种行为数据评估方法及装置
CN111767962A (zh) 基于生成对抗式网络的一阶段目标检测方法、***及装置
CN113822315A (zh) 属性图的处理方法、装置、电子设备及可读存储介质
CN112396428B (zh) 一种基于用户画像数据的客群分类管理方法及装置
CN108198172A (zh) 图像显著性检测方法和装置
CN116415206A (zh) 运营商多数据融合方法、***、电子设备及计算机存储介质
CN111210158B (zh) 目标地址确定方法、装置、计算机设备和存储介质
CN111352926B (zh) 数据处理的方法、装置、设备及可读存储介质
CN111126264A (zh) 图像处理方法、装置、设备及存储介质
CN111275059B (zh) 一种图像处理方法、装置和计算机可读存储介质
CN111325255B (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN110210425A (zh) 人脸识别方法、装置、电子设备及存储介质
CN116910341A (zh) 标签预测方法、装置及电子设备
CN115860482A (zh) 店铺风险识别方法及其装置、设备、介质、产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant