CN107451750A - 民航需求异常发现方法和装置 - Google Patents

民航需求异常发现方法和装置 Download PDF

Info

Publication number
CN107451750A
CN107451750A CN201710682441.8A CN201710682441A CN107451750A CN 107451750 A CN107451750 A CN 107451750A CN 201710682441 A CN201710682441 A CN 201710682441A CN 107451750 A CN107451750 A CN 107451750A
Authority
CN
China
Prior art keywords
date
curve
course line
standard curve
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710682441.8A
Other languages
English (en)
Inventor
吴丽娜
周元炜
贾旭光
曹迎军
王硕
马晓涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Technology Co Ltd
China Travelsky Holding Co
Original Assignee
China Travelsky Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Technology Co Ltd filed Critical China Travelsky Technology Co Ltd
Priority to CN201710682441.8A priority Critical patent/CN107451750A/zh
Publication of CN107451750A publication Critical patent/CN107451750A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种民航需求异常发现方法和装置。其中,该方法包括:根据航线的起飞日期的天级需求指数和起飞日期对应的星期属性,生成航线的星期标准曲线;根据星期标准曲线,生成近期的起飞日期标准曲线;根据航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;根据航线的起飞日期曲线与起飞日期标准曲线,判断航线的需求指数是否异常。通过本发明,解决了民航需求的异常发现依赖于人的经验而不可靠的问题,提升了异常发现的可靠性和发现效率。

Description

民航需求异常发现方法和装置
技术领域
本发明涉及民航数据处理领域,具体而言,涉及一种民航需求异常发现方法和装置。
背景技术
在民航领域,提前预判某航线在未来起飞日期的需求变化情况是辅助航空公司进行航线管理的重要途径之一。虽然航空公司目前能够轻松的获得各航线历史旅客量数据,但是从海量用户查询日志里发现航线需求异常的能力是缺乏的。目前的技术主要能够提供对于各航线历史旅客量的查询功能,不能综合历史航线查询日志从多角度对航线需求变化趋势进行分析,所以国内航空公司对旅客航线需求的异常的判断还主要依赖于人的经验,因此一个智能的、自动化的、有效的异常发现机制和方法能够为航空公司提供稳定的航线需求变化趋势分析的数据支持。
发明内容
本发明提供了一种民航需求异常发现方法和装置,以至少解决相关技术中对民航需求的异常发现依赖于人的经验而不可靠的问题。
根据本发明的一个方面,提供了一种民航需求异常发现方法,包括:
根据航线的起飞日期的天级需求指数和所述起飞日期对应的星期属性,生成所述航线的星期标准曲线;
根据所述星期标准曲线,生成近期的起飞日期标准曲线;
根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;
根据所述航线的起飞日期曲线与所述起飞日期标准曲线,判断所述航线的需求指数是否异常。
可选地,所述方法还包括:
在所述起飞日期标准曲线上作宽度为N天的小窗口,并根据所述星期标准曲线,生成所述小窗口对应的记录日期标准曲线,N为正整数;
根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成所述小窗口对应的记录日期曲线;
根据所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常。
可选地,所述方法还包括:
根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
可选地,所述方法还包括:
根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线、所述航线的起飞日期曲线与除所述航线之外的其他航线的起飞日期曲线、所述航线的记录日期曲线与除所述航线之外的其他航线的记录日期曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
可选地,判断两条曲线之间是否存在异常包括:
在两条曲线的相应位置上分别做两个宽度相等的小窗口,根据该小窗口中的曲线判断该小窗口对应的起飞日期的需求指数在这两条曲线上是否存在异常。
可选地,
所述星期标准曲线用于表示航线起飞日期对应的星期属性下天级需求指数的标准状态,所述星期标准曲线的数量为7条,每条星期标准曲线分别对应一个星期属性;
所述起飞日期标准曲线用于表示航线在过去的近期对起飞日期的天级需求指数的总和的标准状态;
所述记录日期标准曲线用于表示航线在过去的远期中的每天对所述小窗口内的起飞日期的天级需求指数的总和的标准状态;
所述起飞日期曲线用于表示航线在过去的近期对当前起飞日期至未来起飞日期的实际天级需求指数的总和;
所述记录日期标准曲线用于表示航线在过去的远期中的每天对所述小窗口内的起飞日期的实际天级需求指数的总和。
根据本发明的另一个方面,还提供了一种民航需求异常发现装置,包括:
第一生成模块,用于根据航线的起飞日期的天级需求指数和所述起飞日期对应的星期属性,生成所述航线的星期标准曲线;
第二生成模块,用于根据所述星期标准曲线,生成近期的起飞日期标准曲线;
第三生成模块,用于根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;
第一判断模块,用于根据所述航线的起飞日期曲线与所述起飞日期标准曲线,判断所述航线的需求指数是否异常。
可选地,所述装置还包括:
第四生成模块,用于在所述起飞日期标准曲线上作宽度为N天的小窗口,并根据所述星期标准曲线,生成所述小窗口对应的记录日期标准曲线,N为正整数;
第五生成模块,用于根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成所述小窗口对应的记录日期曲线;
第二判断模块,用于根据所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常。
可选地,所述装置还包括:
第一异常分类模块,用于根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
可选地,所述装置还包括:
第二异常分类模块,用于根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线、所述航线的起飞日期曲线与除所述航线之外的其他航线的起飞日期曲线、所述航线的记录日期曲线与除所述航线之外的其他航线的记录日期曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
通过本发明,采用根据航线的起飞日期的天级需求指数和起飞日期对应的星期属性,生成航线的星期标准曲线;根据星期标准曲线,生成近期的起飞日期标准曲线;根据航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;根据航线的起飞日期曲线与起飞日期标准曲线,判断航线的需求指数是否异常的方式,解决了民航需求的异常发现依赖于人的经验而不可靠的问题,提升了异常发现的可靠性和发现效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的民航需求异常发现方法的流程图;
图2是根据本发明实施例的民航需求异常发现装置的结构框图;
图3是根据本发明优选实施例的起飞日期曲线的示意图;
图4是根据本发明优选实施例的记录日期曲线的示意图;
图5是根据本发明优选实施例的异常分类的示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种民航需求异常发现方法。图1是根据本发明实施例的民航需求异常发现方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,根据航线的起飞日期的天级需求指数和起飞日期对应的星期属性,生成航线的星期标准曲线;
步骤S102,根据星期标准曲线,生成近期的起飞日期标准曲线;
步骤S103,根据航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;
步骤S104,根据航线的起飞日期曲线与起飞日期标准曲线,判断航线的需求指数是否异常。
通过上述的步骤,随着起飞日期的星期属性的不同,天级需求指数也表现出与星期属性相对应的变化趋势;例如,周末的天级需求指数随着人们出行的增加或者上班返程人流的增加。因此,在上述步骤中,将各个星期的需求指数分离出来独立考察,将相同星期属性的起飞日期的已查询曲线进行归类并取平均值,则得到对应星期属性的天级需求指数的变化趋势,即星期标准曲线。进一步根据得到的星期标准曲线,生成近期的起飞日期标准曲线,从而得到过去的近期(优选值为7天,刚好能够涵盖周一到周日七天的天级需求指数)对其后的起飞日期的需求指数的总和的变化趋势,即起飞日期标准曲线。最后,根据航线实际的起飞日期曲线和起飞日期标准曲线的差异,来判断航线的需求指数是否异常。可见,采用上述步骤解决了民航需求的异常发现依赖于人的经验而不可靠的问题,提升了异常发现的可靠性和发现效率。
航线的需求指数通过查询量来表示,例如:过去所有时间对某航班在某个起飞日期的查询量即为该航班在这个起飞日期的需求指数。天级需求指数是指过去所有时间每一天中对某航班在某个起飞日期的查询量。
需要说明的是,在步骤S104中判断航线的需求指数是否异常时,除了根据航线的起飞日期曲线与起飞日期标准曲线来判断之外,还可以结合其他的曲线来进一步判断需求指数是否异常甚至对需求指数的异常状况进行分类。
例如:在起飞日期标准曲线上作宽度为N天的小窗口,并根据星期标准曲线,生成小窗口对应的记录日期标准曲线,N为正整数(N优选值为3);根据航线的当前起飞日期至未来起飞日期的天级需求指数,生成小窗口对应的记录日期曲线;根据航线的记录日期曲线与记录日期标准曲线,判断航线的需求指数是否异常。
又例如,根据航线的起飞日期曲线与起飞日期标准曲线、航线的记录日期曲线与记录日期标准曲线,判断航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
又例如,根据航线的起飞日期曲线与起飞日期标准曲线、航线的记录日期曲线与记录日期标准曲线、航线的起飞日期曲线与除航线之外的其他航线的起飞日期曲线、航线的记录日期曲线与除航线之外的其他航线的记录日期曲线,判断航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
可选地,在本实施例中,判断两条曲线之间是否存在异常包括:在两条曲线的相应位置上分别做两个宽度相等的小窗口,根据该小窗口中的曲线判断该小窗口对应的起飞日期的需求指数在这两条曲线上是否存在异常。
可选地,星期标准曲线用于表示航线起飞日期对应的星期属性下天级需求指数的标准状态,星期标准曲线的数量为7条,每条星期标准曲线分别对应一个星期属性;起飞日期标准曲线用于表示航线在过去的近期对起飞日期的天级需求指数的总和的标准状态;记录日期标准曲线用于表示航线在过去的远期中的每天对小窗口内的起飞日期的天级需求指数的总和的标准状态;起飞日期曲线用于表示航线在过去的近期对当前起飞日期至未来起飞日期的实际天级需求指数的总和;记录日期标准曲线用于表示航线在过去的远期中的每天对小窗口内的起飞日期的实际天级需求指数的总和。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种民航需求异常发现装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是根据本发明实施例的民航需求异常发现装置的结构框图,如图2所示,该装置包括:第一生成模块21、第二生成模块22、第三生成模块23和第一判断模块24,其中,
第一生成模块21,用于根据航线的起飞日期的天级需求指数和起飞日期对应的星期属性,生成航线的星期标准曲线;
第二生成模块22,耦合至第一生成模块21,用于根据星期标准曲线,生成近期的起飞日期标准曲线;
第三生成模块23,用于根据航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;
第一判断模块24,耦合至第二生成模块22和第三生成模块23,用于根据航线的起飞日期曲线与起飞日期标准曲线,判断航线的需求指数是否异常。
可选地,装置还包括:第四生成模块,耦合至第一生成模块21,用于在起飞日期标准曲线上作宽度为N天的小窗口,并根据星期标准曲线,生成小窗口对应的记录日期标准曲线,N为正整数;第五生成模块,用于根据航线的当前起飞日期至未来起飞日期的天级需求指数,生成小窗口对应的记录日期曲线;第二判断模块,耦合至第四生成模块和第五生成模块,用于根据航线的记录日期曲线与记录日期标准曲线,判断航线的需求指数是否异常。
可选地,装置还包括:第一异常分类模块,用于根据航线的起飞日期曲线与起飞日期标准曲线、航线的记录日期曲线与记录日期标准曲线,判断航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
可选地,装置还包括:第二异常分类模块,用于根据航线的起飞日期曲线与起飞日期标准曲线、航线的记录日期曲线与记录日期标准曲线、航线的起飞日期曲线与除航线之外的其他航线的起飞日期曲线、航线的记录日期曲线与除航线之外的其他航线的记录日期曲线,判断航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述模块分别位于多个处理器中。
本发明的实施例还提供了一种软件,该软件用于执行上述实施例及优选实施方式中描述的技术方案。
本发明的实施例还提供了一种存储介质。在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
步骤S101,根据航线的起飞日期的天级需求指数和起飞日期对应的星期属性,生成航线的星期标准曲线;
步骤S102,根据星期标准曲线,生成近期的起飞日期标准曲线;
步骤S103,根据航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;
步骤S104,根据航线的起飞日期曲线与起飞日期标准曲线,判断航线的需求指数是否异常。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
为了使本发明实施例的描述更加清楚,下面结合优选实施例进行描述和说明。
为解决现有存在的技术问题,本优选实施例的主要目标是发现航线需求曲线中的异常来辅助对于航线需求的分析。本优选实施例首先对各产品集的航班历史查询数据进行处理和计算,得到星期标准曲线(根据历史数据得到的某航线某起飞日期对应的星期属性下已查询曲线的标准状态),起飞日期标准曲线(根据历史数据得到的某航线某当前日期起飞日期曲线的标准状态)、记录日期标准曲线(某航线起飞日期曲线某小窗口,当前日期的历史z天(例如21天)对该小窗口的需求指数和);然后计算某产品集的起飞日期曲线某小窗口,获取当前日期的起飞日期曲线及记录日期曲线,并分别计算两种日期曲线与其标准曲线及其他航线的起飞日期曲线和记录日期曲线曲线比较的异常值;最后,算法根据异常值对起飞日期曲线小窗口进行分类,得到正常及不同种类的异常,将各窗口的异常标签存到Hive表中。
本发明优选实施例包括以下步骤:
步骤1,数据预处理和标准曲线的初始化:计算某产品集起飞日期在某一范围内的已查询日期曲线,计算天级需求指数曲线;读取标准曲线库中的星期标准曲线,生成起飞日期标准曲线及记录日期标准曲线,进而得到航线该起飞日期曲线小窗口对应的记录日期标准曲线。
步骤2,异常值计算:分别计算起飞日期曲线小窗口异常值、记录日期曲线整体形态异常值、记录日期曲线小窗口异常值。
步骤3,异常发现与分类:根据起飞日期曲线小窗口异常值、记录日期曲线整体形态异常值及记录日期曲线小窗口异常值与其阈值的比较形成分类决策树。依照决策树对异常进行发现和分类。
下面结合附图进行举例说明:
在步骤1中:
标准曲线生成采用下列方式:
读取标准曲线库中的星期标准曲线,生成起飞日期标准曲线及记录日期标准曲线。
针对某一航线,确定当前日期为cd,起飞日期范围为cd+1至cd+60,遍历起飞日期,取其对应的星期标准曲线的后7天需求指数和,即为该航线的起飞日期标准曲线。
针对某一航线起飞日期曲线小窗口,当前日期currentDate范围为cd至cd+2,起飞日期为currentDate+1,遍历当前日期,依次获取起飞日期对应星期标准曲线的后21天需求指数曲线,对得到的需求指数曲线对应位置求和,得到该航线该起飞日期曲线小窗口对应的记录日期标准曲线。
确定分析对象。
为了发现近期和远期日期存在的异常,分别计算近期7天的起飞日期曲线和远期21天的记录日期曲线。针对航班需求指数数据,首先生成起飞日期曲线,如图3所示,该曲线当前日期为2015年5月15日,横轴为起飞日期,纵轴为2015年5月15日及过去7天对未来每个起飞日期天需求指数总和。在该曲线上做宽度为3,步长为1的滑动窗口,异常发现的目标即为发现每个滑动窗口的异常情况。起飞日期曲线仅能发现近期需求指数异常,即当前时间过去7天对未来航班的查询异常,若需求指数的异常发生在距当前日期较远的日期,只根据起飞日期曲线则不能发现该异常。若延长起飞日期曲线生成时间,即将过去7天延长,则会带来近期异常发现敏感性降低的问题。为解决该问题,针对每个滑动小窗口,对应生成了一条记录日期曲线,该曲线横轴为记录日期,即从当前日期前21天到当前日期,纵轴为过去21天每天对小窗口内起飞日期的查询量,用于发现距当前日期较远的异常,如图4所示。
在步骤2中:
异常值计算采用下列方式:
a、计算起飞日期曲线小窗口异常值:
在计算起飞日期曲线小窗口内异常值时不仅考虑了当前时间曲线与该航线标准曲线的比较情况,还比较了该小窗口与其他航线同时间查询状况,并综合考虑了当前时间曲线的整体波动情况。其中通过欧式距离比较当前曲线与标准曲线的物理距离,通过余弦距离比较当前曲线与其他航线的形态差异。算出异常值后再除以“整体曲线减去标准曲线的标准差”,一是反映了整条曲线波动越小,该小窗口内异常情况越突出;二是将不同航线不同数量级的曲线归一化到一个异常值范围内。具体起飞日期小窗口异常值计算公式如下:
fdxOD,i∈{fd|当前时间查询除该OD以外所有OD的起飞日期第i个小窗口曲线}
在上式中,
Sgn(fdOD,i-standardfdOD,i)表示某OD起飞日期曲线第i个小窗口的和减去该OD起飞日期标准曲线的第i个小窗口的和后的符号。
Eud(fdOD,i,standardfdOD,i)表示某OD起飞日期曲线第i个小窗口与该OD起飞日期标准曲线的第i个小窗口的欧式距离。
Ave[Cosine(fdOD,i,fdxOD,i)]表示某OD起飞日期曲线第i个小窗口与所有其他OD起飞日期曲线第i个小窗口的余弦距离的平均值。
StdDev(fdOD-standardfdOD)表示某OD起飞日期曲线减去该OD起飞日期标准曲线后的标准差。
b、计算记录日期曲线整体形态异常值:
记录日期曲线整体形态反映了记录日期曲线与标准曲线形态上的差异性,具体计算公式如下:
在上式中,Cosine(rdOD,i,standardrdOD,i)表示某OD起飞日期曲线第i个小窗口所对应的记录日期曲线与该小窗口的记录日期标准曲线的余弦距离。
c、计算记录日期曲线小窗口异常值:
记录日期曲线小窗口异常值反映了记录日期曲线某一窗口内的异常状况,找出当前记录日期曲线与标准曲线相差最大的窗口,再综合比较该窗口与其他航线的形态差异,并综合考虑该曲线的整体波动情况得出异常值。
i=1,2,3…58;j=1,2,3…17;k=argmaxj[Eud(rdOD,i,j,standardrdOD,i,j)];
fdxOD,i,k∈{rd|当前时间查询除该OD以外所有OD起飞日期曲线第i个小窗口所对应记录日期曲线的第k个小窗口}
在上式中,
max[Eud(rdOD,i,standardrdOD,i)]表示某OD起飞日期曲线第i个小窗口所对应记录日期曲线与该小窗口的记录日期标准曲线的欧式距离的最大值。
Ave[Cosine(rdOD,i,k,rdxOD,i,k)]表示某OD起飞日期曲线第i个小窗口所对应记录日期曲线的第k个小窗口(该小窗口与标准曲线比较欧式距离最大)与所有其他OD起飞日期曲线第i个小窗口所对应记录日期曲线的第k个小窗口的余弦距离的平均值。
StdDev(rdOD,i-standardrdOD,i)表示某OD起飞日期曲线的第i个小窗口所对应记录日期曲线减去该小窗口的记录日期标准曲线后的标准差。
上述的OD(起飞地-到达地)即航线。
在步骤3中:
异常分类采用下列的方式:
如图5所示,航线查询异常发现算法根据起飞日期曲线小窗口异常值、记录日期曲线整体形态异常值及记录日期曲线小窗口异常值与其阈值的比较形成分类决策树。图中共有三个指标的阈值,即起飞日期小窗口异常值相关的阈值Thrd_fd_p,Thrd_fd_n;记录日期曲线整体形态相关的异常值:Thrd_type;记录日期曲线小窗口异常值相关的阈值:Thrd_rd_p,Thrd_rd_n;对每一种异常值,不同范围内的异常值反映了对应曲线与正常形态的偏离情况,根据数据分析和计算,算法确定以上5个阈值。
算法按各曲线的形态,划分为8种类型,各类型的业务含义如下:
正常类型:起飞日期曲线需求指数正常,记录日期曲线需求指数正常;
异常类型1:起飞日期曲线需求指数异常偏高,记录日期曲线需求指数整体形态异常,且存在异常偏高值;
异常类型2:起飞日期曲线需求指数异常偏高,记录日期曲线需求指数整体形态异常,且存在异常偏低值;
异常类型3:起飞日期曲线需求指数异常偏高,记录日期曲线需求指数整体形态正常;
异常类型4:起飞日期曲线需求指数异常偏低,记录日期曲线需求指数整体形态异常,且存在异常偏高值;
异常类型5:起飞日期曲线需求指数异常偏低,记录日期曲线需求指数整体形态异常,且存在异常偏低值;
异常类型6:起飞日期曲线需求指数异常偏低,记记录日期曲线需求指数整体形态正常;
潜在类型:起飞日期曲线需求指数正常,但记录日期曲线整体形态异常。
综上所述,通过本发明的上述实施例,能够有效发现民航旅客航线需求异常,为航空公司收益管理提供数据支持;同时本发明能够对异常的类型进行分类,航空公司可以根据异常类型来提前应对即将来临的需求变化。本发明基于大数据平台采集各渠道全量查询数据,通过对历史起飞日期需求和记录日期需求的分析和挖掘,进而建立异常发现决策分类树,通过决策分类树对未来的起飞日期的异常进行发现和预判,为航空公司提供决策支持。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种民航需求异常发现方法,其特征在于包括:
根据航线的起飞日期的天级需求指数和所述起飞日期对应的星期属性,生成所述航线的星期标准曲线;
根据所述星期标准曲线,生成近期的起飞日期标准曲线;
根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;
根据所述航线的起飞日期曲线与所述起飞日期标准曲线,判断所述航线的需求指数是否异常。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述起飞日期标准曲线上作宽度为N天的小窗口,并根据所述星期标准曲线,生成所述小窗口对应的记录日期标准曲线,N为正整数;
根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成所述小窗口对应的记录日期曲线;
根据所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线、所述航线的起飞日期曲线与除所述航线之外的其他航线的起飞日期曲线、所述航线的记录日期曲线与除所述航线之外的其他航线的记录日期曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
5.根据权利要求1至4中任一项所述的方法,其特征在于,判断两条曲线之间是否存在异常包括:
在两条曲线的相应位置上分别做两个宽度相等的小窗口,根据该小窗口中的曲线判断该小窗口对应的起飞日期的需求指数在这两条曲线上是否存在异常。
6.根据权利要求1至4中任一项所述的方法,其特征在于,
所述星期标准曲线用于表示航线起飞日期对应的星期属性下天级需求指数的标准状态,所述星期标准曲线的数量为7条,每条星期标准曲线分别对应一个星期属性;
所述起飞日期标准曲线用于表示航线在过去的近期对起飞日期的天级需求指数的总和的标准状态;
所述记录日期标准曲线用于表示航线在过去的远期中的每天对所述小窗口内的起飞日期的天级需求指数的总和的标准状态;
所述起飞日期曲线用于表示航线在过去的近期对当前起飞日期至未来起飞日期的实际天级需求指数的总和;
所述记录日期标准曲线用于表示航线在过去的远期中的每天对所述小窗口内的起飞日期的实际天级需求指数的总和。
7.一种民航需求异常发现装置,其特征在于包括:
第一生成模块,用于根据航线的起飞日期的天级需求指数和所述起飞日期对应的星期属性,生成所述航线的星期标准曲线;
第二生成模块,用于根据所述星期标准曲线,生成近期的起飞日期标准曲线;
第三生成模块,用于根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成起飞日期曲线;
第一判断模块,用于根据所述航线的起飞日期曲线与所述起飞日期标准曲线,判断所述航线的需求指数是否异常。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第四生成模块,用于在所述起飞日期标准曲线上作宽度为N天的小窗口,并根据所述星期标准曲线,生成所述小窗口对应的记录日期标准曲线,N为正整数;
第五生成模块,用于根据所述航线的当前起飞日期至未来起飞日期的天级需求指数,生成所述小窗口对应的记录日期曲线;
第二判断模块,用于根据所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一异常分类模块,用于根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
10.根据权利要求3所述的装置,其特征在于,所述装置还包括:
第二异常分类模块,用于根据所述航线的起飞日期曲线与所述起飞日期标准曲线、所述航线的记录日期曲线与所述记录日期标准曲线、所述航线的起飞日期曲线与除所述航线之外的其他航线的起飞日期曲线、所述航线的记录日期曲线与除所述航线之外的其他航线的记录日期曲线,判断所述航线的需求指数是否异常,以及根据判断结果,对异常进行分类。
CN201710682441.8A 2017-08-10 2017-08-10 民航需求异常发现方法和装置 Pending CN107451750A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710682441.8A CN107451750A (zh) 2017-08-10 2017-08-10 民航需求异常发现方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710682441.8A CN107451750A (zh) 2017-08-10 2017-08-10 民航需求异常发现方法和装置

Publications (1)

Publication Number Publication Date
CN107451750A true CN107451750A (zh) 2017-12-08

Family

ID=60491645

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710682441.8A Pending CN107451750A (zh) 2017-08-10 2017-08-10 民航需求异常发现方法和装置

Country Status (1)

Country Link
CN (1) CN107451750A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043187B2 (en) * 2010-12-30 2015-05-26 Humanetics Innovative Solutions, Inc. Method of material modeling for crash test dummy finite element models
CN105679102A (zh) * 2016-03-03 2016-06-15 南京航空航天大学 一种全国飞行流量时空分布预测推演***及方法
CN105809280A (zh) * 2016-03-03 2016-07-27 南京航空航天大学 一种机场容量需求预测方法
CN106779245A (zh) * 2017-01-04 2017-05-31 中国民航信息网络股份有限公司 基于事件的民航需求预测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043187B2 (en) * 2010-12-30 2015-05-26 Humanetics Innovative Solutions, Inc. Method of material modeling for crash test dummy finite element models
CN105679102A (zh) * 2016-03-03 2016-06-15 南京航空航天大学 一种全国飞行流量时空分布预测推演***及方法
CN105809280A (zh) * 2016-03-03 2016-07-27 南京航空航天大学 一种机场容量需求预测方法
CN106779245A (zh) * 2017-01-04 2017-05-31 中国民航信息网络股份有限公司 基于事件的民航需求预测方法和装置

Similar Documents

Publication Publication Date Title
CN112639845B (zh) 确定个人信息查找结果可信度的机器学习***和方法
CN110609759B (zh) 一种故障根因分析的方法及装置
Kumar et al. Crime prediction using K-nearest neighboring algorithm
CN108809745A (zh) 一种用户异常行为检测方法、装置及***
JP5092165B2 (ja) データ構築方法とシステム
US9122995B2 (en) Classification of stream-based data using machine learning
CN102637178A (zh) 一种音乐推荐方法、装置及***
CN112860769B (zh) 一种能源规划数据管理***
CN107545360A (zh) 一种基于决策树的风控智能规则导出方法及***
CN110083507B (zh) 关键性能指标分类方法及装置
CN111159243A (zh) 用户类型识别方法、装置、设备及存储介质
US20170169096A1 (en) Methods and systems for analyzing reading logs and documents thereof
Alghobiri A comparative analysis of classification algorithms on diverse datasets
CN116823496A (zh) 基于人工智能的智能保险风险评估和定价***
Antwi et al. The PerfSim algorithm for concept drift detection in imbalanced data
US20130108180A1 (en) Information processing device, information processing method, and program
CN108171570A (zh) 一种数据筛选方法、装置及终端
US20120166382A1 (en) System and Method for Classifying Data Streams with Very Large Cardinality
KR101621735B1 (ko) 추천 검색어 제공 방법 및 시스템
CN112925899B (zh) 排序模型建立方法、案件线索推荐方法、装置及介质
CN109977131A (zh) 一种房型匹配***
CN106779245B (zh) 基于事件的民航需求预测方法和装置
CN106339293B (zh) 一种基于签名的日志事件提取方法
US20120271789A1 (en) Apparatus and method for prediction development speed of technology
CN107451750A (zh) 民航需求异常发现方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171208