CN107730021B - 一种业务指标优化方法和装置 - Google Patents

一种业务指标优化方法和装置 Download PDF

Info

Publication number
CN107730021B
CN107730021B CN201610652203.8A CN201610652203A CN107730021B CN 107730021 B CN107730021 B CN 107730021B CN 201610652203 A CN201610652203 A CN 201610652203A CN 107730021 B CN107730021 B CN 107730021B
Authority
CN
China
Prior art keywords
information
statistical
name
service index
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610652203.8A
Other languages
English (en)
Other versions
CN107730021A (zh
Inventor
赵静
孟晓莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Hubei Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Hubei Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Hubei Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201610652203.8A priority Critical patent/CN107730021B/zh
Publication of CN107730021A publication Critical patent/CN107730021A/zh
Application granted granted Critical
Publication of CN107730021B publication Critical patent/CN107730021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种业务指标优化方法,包括:分别获取第一业务指标的第一名称和第一统计信息,以及第二业务指标的第二名称和第二统计信息,所述第一统计信息用于表征所述第一业务指标的统计口径,所述第二统计信息用于表征所述第二业务指标的统计口径;对所述第一名称和所述第二名称进行分析,获得所述第一名称和所述第二名称之间的第一关系;对所述第一统计信息和所述第二统计信息进行解析,获得所述第一业务指标的统计口径和所述第二业务指标的统计口径之间的第二关系;根据所述第一关系、所述第二关系和预设优化策略,对所述第一业务指标和所述第二业务指标进行优化。本发明实施例同时还公开了一种业务指标优化装置。

Description

一种业务指标优化方法和装置
技术领域
本发明涉及元数据、数据关系以及调度***优化技术领域,尤其涉及一种业务指标优化方法和装置。
背景技术
随着大数据时代的到来,数据决定着企业的未来发展,随着时间的推移,人们将越来越多的意识到数据对企业的重要性。在长期的经营过程中,一个企业会积累大量的业务指标,这些业务指标会存在冗余等问题,因此对这些业务指标的管理显得尤为重要,以便更好地管理业务指标,进而更好地经营企业。
目前对业务指标管理的传统做法是需要有经验的业务人员和技术人员进行人工梳理,具体的,技术人员会根据业务指标的指标编码、指标名称、指标单位、指标类别、指标业务定义、指标统计口径等指标信息对业务指标进行管理,通过人工统计及识别的方法实现对业务指标的归类、剃重以及业务指标组合分析。
此外,由于在实际管理业务指标时,会涉及到的业务指标的量比较大,现有技术毫无疑问会花费大量的人力,并且还会带来管理的过程深度不够、完整程度不高甚至准确度不高的问题。可见,现有技术无法达到对业务指标的优化,故存在一定的不合理性。
发明内容
为解决上述技术问题,本发明实施例期望提供一种业务指标优化方法和装置,能够通过指标名称和指标统计口径来确定业务指标间的关系,从而实现对业务指标的优化。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供一种业务指标优化方法,所述方法包括:分别获取第一业务指标的第一名称和第一统计信息,以及第二业务指标的第二名称和第二统计信息,所述第一统计信息用于表征所述第一业务指标的统计口径,所述第二统计信息用于表征所述第二业务指标的统计口径;对所述第一名称和所述第二名称进行分析,获得所述第一名称和所述第二名称之间的第一关系;对所述第一统计信息和所述第二统计信息进行解析,获得所述第一业务指标的统计口径和所述第二业务指标的统计口径之间的第二关系;根据所述第一关系、所述第二关系和预设优化策略,对所述第一业务指标和所述第二业务指标进行优化。
第二方面,本发明实施例提供一种业务指标优化装置,所述装置包括:获取模块,用于分别获取第一业务指标的第一名称和第一统计信息,以及第二业务指标的第二名称和第二统计信息,所述第一统计信息用于表征所述第一业务指标的统计口径,所述第二统计信息用于表征所述第二业务指标的统计口径;分析模块,用于对所述第一名称和所述第二名称进行分析,获得所述第一名称和所述第二名称之间的第一关系;解析模块,用于对所述第一统计信息和所述第二统计信息进行解析,获得所述第一业务指标的统计口径和所述第二业务指标的统计口径之间的第二关系;优化模块,用于根据所述第一关系、所述第二关系和预设优化策略,对所述第一业务指标和所述第二业务指标进行优化。
本发明实施例提供了一种业务指标优化方法和装置,首先,分别获取第一业务指标的第一名称与第一统计信息,以及第二业务指标的第二名称与第二统计信息,第一统计信息用于表征第一业务指标的统计口径,第二统计信息用于表征第二业务指标的统计口径;然后,对第一名称和第二名称进行分析,获得第一名称和第二名称之间的第一关系;接着,对第一统计信息和第二统计信息进行解析,获得第一业务指标的统计口径和第二业务指标的统计口径之间的第二关系;之后,根据第一关系、第二关系和预设优化策略,对第一业务指标和第二业务指标进行优化。这样一来,就可通过业务指标的名称和统计信息(即业务指标统计口径)来确定出业务指标间的名称关系和统计关系,再结合预设优化策略就可实现对业务指标的优化,大大提高了业务指标优化的效率以及准确度,提供良好的用户体验。
附图说明
图1为本发明实施例提供的一种指标优化方法流程图;
图2为本发明实施例提供的一种分词结果示意图;
图3为本发明实施例提供的另一种分词结果示意图;
图4为本发明实施例提供的一种分词比较示意图;
图5为本发明实施例提供的一种确定统计口径关系流程图;
图6为本发明实施例提供的另一种指标优化方法流程图;
图7为本发明实施例提供的一种指标优化装置结构示意图;
图8为本发明实施例提供的另一种指标优化装置结构示意图;
图9为本发明实施例提供的其他一种指标优化装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本发明实施例提供一种业务指标优化方法,应用于业务指标相似度的识别装置,该装置可以设置于普通服务器,也可以设置于网络服务器,本发明实施例不做具体限定。
如图1所示,该方法包括:
S101、分别获取第一业务指标的第一名称和第一统计信息,以及第二业务指标的第二名称和第二统计信息;
这里,第一统计信息用于表征第一业务指标的统计口径,第二统计信息用于表征第二业务指标的统计口径。
在实际应用中,一个确定的业务指标的指标信息通常情况下包括:指标编码、指标名称、指标单位、指标类别、指标业务定义和指标统计口径。其中,指标编码是指指标的唯一标识;指标名称是指指标的短名称,例如:活跃客户数、沉默客户数等;指标单位是指指标的计量单位,例如:户、万元等;指标类别是指指标的分类,例如:收入类、级别类、市场竞争类等;指标业务定义是指企业管理人员或业务人员可以理解的一段针对指标的文字描述;指标统计口径是指该指标的计算公式,属于技术层面的定义,比如:查询统计脚本、计算公式等。
在本实施例中,选取业务指标的指标名称和指标统计口径这两个指标信息,来实现对业务指标的优化。值得说明的是,在实际中,会对所有的业务指标进行优化,本实施例中仅以第一业务指标和第二业务指标为例,说明该优化过程,对除第一业务指标和第二业务指标之外的所有业务指标的优化过程同对第一业务指标和第二业务指标的优化过程完全相同,本实施例中就不再详述。
在对第一业务指标和第二业务指标进行优化的第一步,就需要从业务指标的存储空间内获取到第一业务指标和第二业务指标的指标名称与指标统计口径。
S102、对第一名称和第二名称进行分析,获得第一名称和第二名称之间的第一关系;
具体的,根据预设词库,识别第一名称,获得第一结果;根据预设词库,识别第二名称,获得第二结果;根据第一结果、第二结果和第一预设规则,确定第一关系。
这里,预设词库包括维度词库和度量词库,其中,维度词库是由保护维度名称以及维度的内容构成,以客户状态维度为例,该维度词库包括:有效客户、无效客户、会员(veryimportant people,VIP)、普通等。度量词库是由度量信息构成,例如:客户数、收入、流量、访问次数等。
首先,将第一名称分别匹配维度词库和度量词库,确定出第一名称中的第一维度词和第一度量词;将第二名称分别匹配维度词库和度量词库,确定出第二名称中的第二维度词和第二度量词;标记第一维度词和第一度量词为第一结果;标记第二维度词和第二度量词为第二结果。
本步骤会对第一名称匹配维度词库和度量词库,进而确定出第一结果;同时,也会对第二名称匹配维度词库和度量词库,进而确定出第二结果。该匹配过程就是对第一名称和第二名称进行分词处理的过程。
示例的,“月有效通话客户数”和“月通信有效用户数”这两个名称为例,说明该匹配过程,即分词处理过程,在该分词处理过程中采用开源项目Luence,同时结合词典分词和文法分析算法的中文分词组件,选取迭代最细粒度切分算法,该算法遵循正向最大匹配和最细分词的原则,对名称进行分词处理。对“月有效通话客户数”的分词结果为:时间维度变量:月,客户状态维度变量:有效,业务类别维度变量:语音(通话属于语音的一种),度量变量:客户数,分词结果如图2所示;对“月通信有效用户数”的分词结果为:时间维度变量:月,业务类别维度变量:语音(通话属于语音的一种),客户状态维度变量:有效,度量变量:用户数,分词结果如图3所示。
然后,对第一结果和第二结果进行比较,得到比较结果。
示例的,“月有效通话客户数”和“月通信有效用户数”为例,在S102的基础上,同时参考图2和图3,对“月有效通话客户数”和“月通信有效用户数”的分词结果进行比较,其中,比较的内容包括维度变量比较和度量变量比较,具体的,分别比较“月有效通话客户数”与“月通信有效用户数”的时间维度变量、客户状态维度变量、业务类别维度变量和度量变量,比较的示意图如图4所示。
值得说明的是,一方面,第一结果和第二结果的维度变量与度量变量的比较与其所在位置无关,例如:“月沉默飞信用户数”就等同于“月飞信沉默用户数”;第二方面,在比较过程中需要考虑别名,例如:“客户数”和“用户数”是表示同一意思的词,它们之间相互为彼此的别名,因此,当两个度量变量不完全相同,但相互为彼此的别名时,比较结果认为该两个度量变量是一致的。
之后,依据第一预设规则和比较结果,确定第一关系。
这里,第一关系是指第一业务指标的第一名称与第二业务指标的第二名称之间的名称关系,其中,第一预设规则为:
当两个业务指标的维度变量和度量变量都一致,则两个业务指标的名称关系为一致关系;
当两个业务指标的维度变量一致,而度量变量不一致,则两个业务指标的名称关系为相关关系;
当两个业务指标的度量变量一致,而一个业务指标的维度变量多于且包含另一个指标的维度变量,则两个业务指标的名称关系为包含关系;
当处了上述三种情况之外,则两个业务指标的名称关系为无关关系。
值得说明的是,上述第一预设规则仅仅为本实施列举的一个较佳的评判规则,本实施例对评判规则并不做限定。
这里,下表1示例性地说明该第一预设规则的具体使用。
Figure BDA0001074912490000061
表1
S103、对第一统计信息和第二统计信息进行解析,获得第一业务指标的统计口径和第二业务指标的统计口径之间的第二关系;
具体的,分别对第一统计信息和第二统计信息进行解析,获得第一统计信息的第一属性信息以及第二统计信息的第二属性信息;根据第一属性信息、第二属性信息和第二预设规则,确定第二关系。
这里,会依据预设解析规则,分别对第一统计信息和第二统计信息进行解析,示例的,本实施例中是利用结构化查询语言(Structured Query Language,SQL)解析器来解析第一统计信息和第二统计信息。其中,统计信息中包括sql语句,sql解析器能够根据输入的sql语句,经过sql解析器解析之后,输出统计信息的统计表,所述统计表用于记录统计信息的属性信息。sql语句是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库***。值得说明的是,本实施例中的统计表是属性信息的一种表征形式。
其中,根据第一属性信息、第二属性信息和第二预设规则,确定第二关系,包括两种可行方案:
方案一:
判断第一属性信息与第二属性信息是否相同;如果第一属性信息和第二属性信息相同,确定第二关系为相关;如果第一属性信息和第二属性信息不相同,确定第二关系为不相关。
示例的,采用解析器来解析第一统计信息和第二统计信息之后,解析出第一统计信息的第一统计表,并且解析出第二统计信息的第二统计表,其中,第一统计表是第一属性信息的一种表征形式,第二统计表是第二属性信息的一种表征形式。当第一统计表和第二统计表是同一张表(即第一属性信息和第二属性信息相同)时,确定第二关系为相关;当第一统计表和第二统计表不是同一张表(即第一属性信息和第二属性信息不相同)时,确定第二关系为不相关。
值得说明的是,第二关系为相关时,表明第一业务指标的统计口径与第二业务指标的统计口径相同或者相互包含;第二关系为不相关时,表明第一业务指标的统计口径与第二业务指标的统计口径不存至少一部分相同或者相互包含。其中,相关具体包括一致和相互包含。
示例的,如图5所示,第一属性信息和第二属性信息相同时,确定第二关系为相关的过程包括:
S1051、对象化sql语句。
这里,分别对象化第一sql语句和第二sql语句,即从sql语句中解析出有关sql脚本的属性信息。
S1052、从对象化后的sql语句获取子条件。
具体的,从TWhere(一种sql语句)的节点获取子节点,具体操作为where解析,通过该解析,能够获得where变量、逻辑值和比较值,而where变量、逻辑值和比较值便为sql解析结果。
S1053、比较第一子条件和第二子条件,获得比较结果。
具体的,分别比较两个统计信息的where变量、逻辑值和比较值,进而通过条件对比,得到两个统计信息在where变量相同的情况下的逻辑值关系和比较值关系。
S1054、根据比较结果,确定第一统计信息和第二统计信息的第二关系。
第一统计信息和第二统计信息的第二关系是与两个统计信息在where变量相同的情况下的逻辑值关系和比较值关系相同的,其中,两个统计信息在where变量相同的情况下的逻辑值关系包括:一致关系、包含关系和无关关系;两个统计信息在where变量相同的情况下的比较值关系包括:一致关系、包含关系和无关关系;同样的,第一统计信息和第二统计信息的统计关系也包括:一致关系、包含关系和无关关系。
示例的,第一业务指标为“月有效通话客户数”,其对应的sql语句为“Selectcount(1)from user where state=1and telunm>0”;第二业务指标为“月有效主叫通话客户数”,其sql对应的语句为“Select count(1)from user where state=1andtelunm>0andcallnum>0”,通过对条件分析,分析比较两个统计信息的where变量、逻辑值和比较值,得到“月有效通话客户数”和“月有效主叫通话客户数”之间的第二关系为包含关系。
方案二:
判断第一属性信息与第二属性信息是否相同;如果第一属性信息和第二属性信息相同,确定第二关系为相关。如果第一属性信息和第二属性信息不相同,根据预设的第一血缘关系信息查找出第一统计信息的第一源信息,并根据预设的第二血缘关系信息查找出第二统计信息的第二源信息;判断第一源信息与第二源信息是否相同;如果第一源信息与第二源信息相同,确定第二关系为相关;如果第一源信息与第二源信息不相同,确定第二关系为不相关。
这里,第一血缘关系信息用于存储第一统计信息的源信息,第二血缘关系信息用于存储第二统计信息的源信息。在实际优化中,还会存在第一属性信息和第二属性信息不相同的情况,那么在该情况下,并不会立即断定第二关系为不相关,而会在第一血缘关系信息和第二血缘关系中查找出各自对应的所有源信息,并将各自对应的所有源信息保存到一个数组中;最后通过比较数组,来确定出这两个统计信息是否拥有共同的源信息;进而确定出第二关系。具体的,如果第一源信息与第二源信息相同,确定第二关系为相关;如果第一源信息与第二源信息不相同,确定第二关系为不相关。其中,血缘关系是记录数据表的来源(即业务指标的指标技术口径的来源),是通过统计计算而来。血缘关系信息的预先建立是经过一段时间采集,从运行日志或数据库的执行记录中获取数据中心所有的执行sql脚本,经过sql解析器,建立数据的输入和输出的关系。
值得说明的是,第二关系为相关时,表明第一业务指标的统计口径与第二业务指标的统计口径相同或者相互包含;第二关系为不相关时,表明第一业务指标的统计口径与第二业务指标的统计口径不存至少一部分相同或者相互包含。
S104、根据第一关系、第二关系和预设优化策略,对第一业务指标和第二业务指标进行优化。
当第一关系为一致,第二关系也为一致,则表明这两个业务指标没有问题,且完全一致,预设优化策略会将这两个业务指标进行合并,即删除其中一个业务指标;
当第一关系为一致,第二关系为不相关,则表明这两个业务指标存在同名不同义的问题,预设优化策略会将对这两个业务指标中的一个进行修改名称;
当第一关系为不相关,第二关系为一致,则表明这两个业务指标存在同义不同名的问题,预设优化策略会将对这两个业务指标中的一个进行修改名称或删除其中一个业务指标(即下线其中一个业务指标);
当第一关系和第二关系中一个关系为包含,而另一个关系不为包含,则表明这两个业务指标存在指标名称与指标技术口径不一致的问题,预设优化策略会将对这两个业务指标中的一个进行修改指标技术口径。
这样,便消除了业务指标间存在的问题,从而优化了业务指标。
这样一来,就可通过业务指标的名称和统计sql脚本信息(即业务指标统计口径)来确定出业务指标间的名称关系和统计口径关系,再结合预设优化策略就可实现对业务指标的优化,大大提高了业务指标优化的效率以及准确度,提供良好的用户体验。
实施例二
本发明实施例提供一种业务指标优化方法,应用于业务指标相似度的识别装置,假设A、B、C、D和E为某一企业S积累到的5个业务指标,其中,A和B之间存在同名同义的问题,现以对A、B、C、D和E这5个业务指标进行优化为例说明本实施例的业务指标优化方法,如图6所示,该方法包括:
S201、获取A、B、C、D和E这5个业务指标的指标名称与统计信息。
这里统计信息是指A、B、C、D和E这5个业务指标的统计口径信息。
S202、根据预设词库,识别A、B、C、D和E这5个指标名称的识别结果。
具体的,会识别出A、B、C、D和E这5个指标名称的维度变量和度量变量。
S203、根据识别结果和第一预设规则,确定这5个指标名称的第一关系。
从5个识别结果中能够发现A和B的维度变量和度量变量完全一致,那么就可确定出A和B指标名称的第一关系为一致关系,其他业务指标指标名称间的第一关系为不相关。
S204、解析A、B、C、D和E这5个业务指标的统计信息,获得属性信息。
具体的,针对A、B、C、D和E这5个业务指标的统计口径信息,采用sql解析器解析出A、B、C、D和E这5个业务指标的属性信息。
S205、判断A、B、C、D和E这5个业务指标的属性信息是否相同,若是,则执行S206;否则执行S207。
由于A、B、C、D和E这5个业务指标的属性信息相同和A、B、C、D和E这5个业务指标的属性信息不同这两种情况会对应不同第二关系的确定方法,因此有必要在确定统计口径关系前,判断出A、B、C、D和E这5个业务指标的属性信息是否相同。
S206、确定第二关系为相关。
根据本实施例的假设,能够确定出A和B之间的的第二关系为相关,且进一步的,A和B的第二关系为一致关系。
S207、确定第二关系为不相关。
根据本实施例的假设,除A和B之间的第二关系之外其余业务指标间的第二关系为不相关。
S208、根据第一关系、第二口径关系和预设优化策略,优化这5个业务指标。
由于A和B的名称第一和第二关系均为一致关系,说明A和B同名同义,出现了冗余,故会根据预设优化策略删除A或B。其他业务指标的第一关系和第二关系均为不相关,即其他业务指标不同名也不同义,不存在任何问题,无需优化。
这样一来,就可通过业务指标的名称和统计sql脚本信息(即业务指标统计口径)来确定出业务指标间的名称关系和统计口径关系,再结合预设优化策略就可实现对业务指标的优化,大大提高了业务指标优化的效率以及准确度,提供良好的用户体验。
实施例三
本发明实施例提供一种业务指标优化装置30,如图7所示,该装置30包括:获取模块301,用于分别获取第一业务指标的第一名称和第一统计信息,以及第二业务指标的第二名称和第二统计信息,第一统计信息用于表征第一业务指标的统计口径,第二统计信息用于表征第二业务指标的统计口径;分析模块302,用于对第一名称和第二名称进行分析,获得第一名称和第二名称之间的第一关系;解析模块303,用于对第一统计信息和第二统计信息进行解析,获得第一业务指标的统计口径和第二业务指标的统计口径之间的第二关系;优化模块304,用于根据第一关系、第二关系和预设优化策略,对第一业务指标和第二业务指标进行优化。
在本发明其它实施例中,分析模块302具体用于根据预设词库,识别第一名称,获得第一结果;根据预设词库,识别第二名称,获得第二结果;根据第一结果、第二结果和第一预设规则,确定第一关系。
在本发明其它实施例中,如图8所示,解析模块303包括:解析子模块3031,用于分别对第一统计信息和第二统计信息进行解析,获得第一统计信息的第一属性信息以及第二统计信息的第二属性信息;确定子模块3032,用于根据第一属性信息、第二属性信息和第二预设规则,确定第二关系。
在本发明其它实施例中,确定子模块3032,具体用于判断第一属性信息与第二属性信息是否相同;如果第一属性信息和第二属性信息相同,确定第二关系为相关;如果第一属性信息和第二属性信息不相同,确定第二关系为不相关;
在本发明其它实施例中,如图9所示,上述装置30还包括:查找模块305、判断模块306以及确定模块307;其中,查找模块305,用于如果第一属性信息和第二属性信息不相同,根据预设的第一血缘关系信息查找出第一统计信息的第一源信息,并根据预设的第二血缘关系信息查找出第二统计信息的第二源信息;判断模块306,用于判断第一源信息与第二源信息是否相同;确定模块307,用于如果第一源信息与第二源信息相同,确定第二关系为相关;如果第一源信息与第二源信息不相同,确定第二关系为不相关。
进一步地,第二关系为相关时,第一业务指标的统计口径与第二业务指标的统计口径相同或者相互包含;第二关系为不相关时,第一业务指标的统计口径与第二业务指标的统计口径不存至少一部分相同或者相互包含。
在实际应用中,上述获取模块、分析模块、解析模块、优化模块、查找模块、判断模块、确定模块、解析子模块和确定子模块均可由位于指标优化装置中的中央处理器(Central Processing Unit,CPU)、微处理器(Micro Processor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable GateArray,FPGA)等实现,本发明实施例不做具体限定。
这里需要指出的是:以上装置实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的描述而理解,为节约篇幅,这里不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1.一种业务指标优化方法,其特征在于,所述方法包括:
分别获取第一业务指标的第一名称和第一统计信息,以及第二业务指标的第二名称和第二统计信息,所述第一统计信息用于表征所述第一业务指标的统计口径,所述第二统计信息用于表征所述第二业务指标的统计口径;
对所述第一名称和所述第二名称进行分析,获得所述第一名称和所述第二名称之间的第一关系;
对所述第一统计信息和所述第二统计信息进行解析,获得所述第一业务指标的统计口径和所述第二业务指标的统计口径之间的第二关系;
根据所述第一关系、所述第二关系和预设优化策略,对所述第一业务指标和所述第二业务指标进行优化。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一名称和所述第二名称进行分析,获得所述第一名称和所述第二名称之间的第一关系,包括:
根据预设词库,识别所述第一名称,获得第一结果;
根据预设词库,识别所述第二名称,获得第二结果;
根据所述第一结果、所述第二结果和第一预设规则,确定所述第一关系。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一统计信息和所述第二统计信息进行解析,获得所述第一业务指标的统计口径和所述第二业务指标的统计口径之间的第二关系,包括:
分别对所述第一统计信息和所述第二统计信息进行解析,获得所述第一统计信息的第一属性信息以及所述第二统计信息的第二属性信息;
根据所述第一属性信息、所述第二属性信息和第二预设规则,确定所述第二关系。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一属性信息、所述第二属性信息和第二预设规则,确定所述第二关系,包括:
判断所述第一属性信息与所述第二属性信息是否相同;
如果所述第一属性信息和所述第二属性信息相同,确定所述第二关系为相关;
如果所述第一属性信息和所述第二属性信息不相同,确定所述第二关系为不相关。
5.根据权利要求4所述的方法,其特征在于,在所述判断所述第一属性信息与所述第二属性信息是否相同之后,所述方法还包括:
如果所述第一属性信息和所述第二属性信息不相同,根据预设的第一血缘关系信息查找出所述第一统计信息的第一源信息,并根据预设的第二血缘关系信息查找出所述第二统计信息的第二源信息;
判断所述第一源信息与所述第二源信息是否相同;
如果所述第一源信息与所述第二源信息相同,确定所述第二关系为相关;
如果所述第一源信息与所述第二源信息不相同,确定所述第二关系为不相关。
6.根据权利要求4或5所述的方法,其特征在于,所述第二关系为相关时,所述第一业务指标的统计口径与所述第二业务指标的统计口径相同或者存在至少一部分相同;所述第二关系为不相关时,所述第一业务指标的统计口径与所述第二业务指标的统计口径不存在相同的至少一部分。
7.一种业务指标优化装置,其特征在于,所述装置包括:
获取模块,用于分别获取第一业务指标的第一名称和第一统计信息,以及第二业务指标的第二名称和第二统计信息,所述第一统计信息用于表征所述第一业务指标的统计口径,所述第二统计信息用于表征所述第二业务指标的统计口径;
分析模块,用于对所述第一名称和所述第二名称进行分析,获得所述第一名称和所述第二名称之间的第一关系;
解析模块,用于对所述第一统计信息和所述第二统计信息进行解析,获得所述第一业务指标的统计口径和所述第二业务指标的统计口径之间的第二关系;
优化模块,用于根据所述第一关系、所述第二关系和预设优化策略,对所述第一业务指标和所述第二业务指标进行优化。
8.根据权利要求7所述的装置,其特征在于,所述分析模块,具体用于根据预设词库,识别所述第一名称,获得第一结果;根据预设词库,识别所述第二名称,获得第二结果;根据所述第一结果、所述第二结果和第一预设规则,确定所述第一关系。
9.根据权利要求7所述的装置,其特征在于,所述解析模块,包括:
解析子模块,用于分别对所述第一统计信息和所述第二统计信息进行解析,获得所述第一统计信息的第一属性信息以及所述第二统计信息的第二属性信息;
确定子模块,用于根据所述第一属性信息、所述第二属性信息和第二预设规则,确定所述第二关系。
10.根据权利要求9所述的装置,其特征在于,所述确定子模块,具体用于判断所述第一属性信息与所述第二属性信息是否相同;如果所述第一属性信息和所述第二属性信息相同,确定所述第二关系为相关;如果所述第一属性信息和所述第二属性信息不相同,确定所述第二关系为不相关。
11.根据权利要求10所述的装置,其特征在于,所述装置,还包括:查找模块、判断模块和确定模块;其中,
所述查找模块,用于如果所述第一属性信息和所述第二属性信息不相同,根据预设的第一血缘关系信息查找出所述第一统计信息的第一源信息,并根据预设的第二血缘关系信息查找出所述第二统计信息的第二源信息;
所述判断模块,用于判断所述第一源信息与所述第二源信息是否相同;
所述确定模块,用于如果所述第一源信息与所述第二源信息相同,确定所述第二关系为相关;如果所述第一源信息与所述第二源信息不相同,确定所述第二关系为不相关。
CN201610652203.8A 2016-08-10 2016-08-10 一种业务指标优化方法和装置 Active CN107730021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610652203.8A CN107730021B (zh) 2016-08-10 2016-08-10 一种业务指标优化方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610652203.8A CN107730021B (zh) 2016-08-10 2016-08-10 一种业务指标优化方法和装置

Publications (2)

Publication Number Publication Date
CN107730021A CN107730021A (zh) 2018-02-23
CN107730021B true CN107730021B (zh) 2020-11-03

Family

ID=61199429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610652203.8A Active CN107730021B (zh) 2016-08-10 2016-08-10 一种业务指标优化方法和装置

Country Status (1)

Country Link
CN (1) CN107730021B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776861A (zh) * 2016-11-28 2017-05-31 北京亚信数据有限公司 一种指标一致性分析方法及分析***
CN110516009A (zh) * 2019-08-21 2019-11-29 北京互金新融科技有限公司 指标***的建立方法、建立装置、存储介质和处理器

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289373B (zh) * 2011-07-28 2013-08-21 福建富士通信息软件有限公司 一种实现指标评价体系动态配置的方法
CN103412956A (zh) * 2013-08-30 2013-11-27 北京中科江南软件有限公司 异构数据源的数据加工处理方法及***
CN104598780B (zh) * 2013-10-31 2017-09-01 阿里巴巴集团控股有限公司 账户识别方法和***
CN103559270A (zh) * 2013-11-04 2014-02-05 北京中搜网络技术股份有限公司 一种词条的存储和管理方法

Also Published As

Publication number Publication date
CN107730021A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
US9798831B2 (en) Processing data in a MapReduce framework
US9996558B2 (en) Method and system for accessing a set of data tables in a source database
WO2017076263A1 (zh) 融合知识库处理方法和装置及知识库管理***、存储介质
US20080162455A1 (en) Determination of document similarity
CN109117440B (zh) 一种元数据信息获取方法、***和计算机可读存储介质
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
CN109688137A (zh) 一种sql注入攻击的检测方法、***及相关组件
CN110597844B (zh) 异构数据库数据统一访问方法及相关设备
WO2017091985A1 (zh) 停用词识别方法与装置
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
CN104679646A (zh) 一种用于检测sql代码缺陷的方法和装置
CN114461644A (zh) 一种数据采集方法、装置、电子设备及存储介质
CN109902154A (zh) 信息处理方法、装置、服务设备及计算机可读存储介质
CN107730021B (zh) 一种业务指标优化方法和装置
US10467276B2 (en) Systems and methods for merging electronic data collections
CN113626558B (zh) 一种基于智能推荐的字段标准化的方法和***
JP7470235B2 (ja) 語彙抽出支援システムおよび語彙抽出支援方法
CN115470861A (zh) 数据处理方法、装置和电子设备
US8090750B2 (en) Prompting of an end user with commands
CN111428037B (zh) 一种分析行为政策匹配性的方法
CN114416848A (zh) 基于数据仓库的数据血缘关系处理方法及装置
CN114064606A (zh) 数据库迁移方法、装置、设备、存储介质和***
JP2017010376A (ja) マートレス検証支援システムおよびマートレス検証支援方法
CN111311329B (zh) 标签数据获取方法、装置、设备及可读存储介质
CN115292297B (zh) 一种构建数据仓库数据质量监测规则的方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant