CN104268064B - 产品日志的异常诊断方法和装置 - Google Patents

产品日志的异常诊断方法和装置 Download PDF

Info

Publication number
CN104268064B
CN104268064B CN201410461063.7A CN201410461063A CN104268064B CN 104268064 B CN104268064 B CN 104268064B CN 201410461063 A CN201410461063 A CN 201410461063A CN 104268064 B CN104268064 B CN 104268064B
Authority
CN
China
Prior art keywords
log
daily record
product
abnormal
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410461063.7A
Other languages
English (en)
Other versions
CN104268064A (zh
Inventor
杜鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Taile Culture Technology Co ltd
Original Assignee
Beijing Yinzhibang Culture Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yinzhibang Culture Technology Co ltd filed Critical Beijing Yinzhibang Culture Technology Co ltd
Priority to CN201410461063.7A priority Critical patent/CN104268064B/zh
Publication of CN104268064A publication Critical patent/CN104268064A/zh
Application granted granted Critical
Publication of CN104268064B publication Critical patent/CN104268064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种产品日志的异常诊断方法和装置。所述方法包括:获取对产品日志进行异常检验后的待异常诊断日志;提取所述待异常诊断日志中满足一致性规则的待定位日志;基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。本发明优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。

Description

产品日志的异常诊断方法和装置
技术领域
本发明实施例涉及计算机技术,尤其涉及一种产品日志的异常诊断方法和装置。
背景技术
随着互联网技术和信息处理技术的不断发展,越来越多的终端用户接入了互联网,并在日常的工作、学习和生活中使用各种互联网产品。例如:百度搜索、百度音乐以及百度地图等。当终端用户对上述互联网产品进行操作时,***会产生对应的产品日志以记录用户操作行为。其中,产品日志既能反映出产品各方面的运行情况,也有助于产品服务提供商了解用户的上网行为,因此,其可为互联网产品提供技术上的运行保障和改进依据。
在现有的产品日志分析过程中,如果发现产品日志存在异常后,异常排查人员主要依靠个人经验,通过人工分析、人工查找的方式来获取产品日志中的异常日志并据此完成相应的异常诊断。但是,随着互联网产品功能的不断丰富,产品复杂性的不断提高,产品出现异常的概率也在不断加大,在使用现有技术来完成异常诊断的过程中,需要排查人员投入的时间和精力也会较多,测试效率低,测试步骤繁琐,人力成本投入较大,无法满足人们日益增长的高效化、便捷化的产品日志的异常诊断需求。
发明内容
有鉴于此,本发明实施例提供一种产品日志的异常诊断方法和装置,以优化现有的产品日志诊断技术,满足人们日益增长的高效化、便捷化的产品日志的异常诊断需求。
在第一方面,本发明实施例提供了一种产品日志的异常诊断方法,包括:
获取对产品日志进行异常检验后的待异常诊断日志;
提取所述待异常诊断日志中满足一致性规则的待定位日志;
基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
在第二方面,本发明实施例提供了一种产品日志的异常诊断装置,包括:
待异常诊断日志获取单元,用于获取对产品日志进行异常检验后的待异常诊断日志;
待定位日志提取单元,用于提取所述待异常诊断日志中满足一致性规则的待定位日志;
异常日志定位单元,用于基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
附图说明
图1是本发明第一实施例的一种产品日志的异常诊断方法的流程图;
图2是本发明第二实施例的一种产品日志的异常诊断方法的流程图;
图3是本发明第三实施例的一种产品日志的异常诊断方法的流程图;
图4是本发明第四实施例的一种产品日志的异常诊断方法的流程图;
图5是本发明第五实施例的一种产品日志的异常诊断方法的流程图;
图6是本发明第六实施例的一种产品日志的异常诊断方法的流程图;
图7是本发明第七实施例的一种产品日志的异常诊断方法的流程图;
图8是本发明第八实施例的一种产品日志的异常诊断装置的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
首先将本发明各实施例的应用场景及布局简述如下:
在本发明各实施例中,为了最终完成对产品日志的异常诊断,需要首先获取对产品日志进行异常检验后的待异常诊断日志。异常检验一般是初步发现异常的操作,异常诊断是在有异常的日志中进行异常定位和识别的诊断操作。
其中,对产品日志进行异常检验主要包括下述两种场景的异常检验:
1、差异化数据的异常检验:用于完成对来源于不同数据平台的产品日志之间的异常检验。
在一个具体的应用场景中,一个互联网产品现有的日志统计平台为第一数据平台,该数据平台中的数据来源为与该互联网产品对应的各个底层日志,第一数据平台通过将底层日志进行一定的过滤处理后(例如,将爬虫日志、静态资源请求日志,以及底层日志数据中的一段时间内PV(Page View,页面浏览量或点击量)或者UV(Unique Visitor,独立访客)超过预设门限值后的日志过滤掉),作为产品日志进行存储;随着技术的不断进步,产品运营商希望将各个底层日志进行更加标准化的管理,例如,通过数据仓库进行管理,可以将各个底层日志通过ETL(Extract-Transform-Load,萃取-转置-加载)的数据仓库技术处理后,作为产品日志存储于第二数据平台(数据仓库)中。为了验证第二数据平台中存储的各个产品日志的准确性,可以通过对第一数据平台和第二数据平台中存储的产品日志进行异常检验,完成对产品日志的异常诊断。
2、非差异化数据的异常检验:用于完成对来源于同一数据平台的不同时间区间的产品日志之间的异常检验。
在一个具体的应用场景中,产品运营商可以通过同一数据平台中各个产品日志,计算该互联网产品在不同时间区间的PV值或者UV值,进而可以对不同时间段的数据突发异常进行异常检验,进而完成对产品日志的异常诊断。
在本文的第二实施例和第三实施例主要针对差异化数据的异常检验进行详细描述;第四实施例—第七实施例主要针对非差异化数据的异常检验进行详细描述。
第一实施例
图1是本发明第一实施例的一种产品日志的异常诊断方法流程图,本实施例的方法可以由产品日志的异常诊断装置来执行,该装置可通过硬件和/或软件的方式实现,一般可集成于用于完成产品日志异常诊断的服务器中。本实施例的方法具体包括如下操作:
110、获取对产品日志进行异常检验后的待异常诊断日志。
在本实施例中,异常诊断服务器获取对产品日志进行异常检验后的待异常诊断日志。
在本实施例中,待异常诊断日志具体为通过异常检验后存在异常,并需要进行后续的异常诊断的产品日志。
其中,所述待异常诊断日志可以为来源于至少两个数据平台的至少两个日志数据组,也可以为来源于同一目标数据平台的待异常诊断日志,对此并不进行限制。
在一个具体例子中,获取对产品日志进行异常检验后的待异常诊断日志可以具体包括:
获取第一数据平台和第二数据平台在设定时间区间(例如,2014.8.87:00:00-8:00:00)的产品日志,构成第一日志数据组和第二日志数据组;
计算与第一日志数据组和第二日志数据组分别对应的校验指标值(例如,PV值或者UV值等);
如果与第一日志数据组对应的校验指标值和与第二日志数据组对应的校验指标值之间存在差异(例如,差异值大于预定阈值),确定第一日志数据组和第二日志数据组中存在异常(需要进行后续的异常诊断),并将第一日志数据组与第二日志数据组作为待异常诊断日志。
在另一个具体例子中,获取对产品日志进行异常检验后的待异常诊断日志可以具体包括:
获取与同一目标数据平台的至少三个时间区间对应的至少三个日志数据组;
计算与该至少三个日志数据组分别对应的校验指标值;
如果目标日志数据组与其余各个日志数据组的校验指标值之间存在差异,确定该目标日志数据组中存在异常,并将该目标日志数据组作为待异常诊断日志。
具体的,针对同一目标数据平台,获取与2014.8.87:00:00-8:00:00对应的第三日志数据组,与2014.8.88:00:00-9:00:00对应的第四日志数据组,以及与2014.8.89:00:00-10:00:00对应的第五日志数据组;计算第三日志数据组的PV值为520,第四日志数据组的PV值为525,第五日志数据组的PV值为1850;若预先规定当两个差异值大于100时,确定两个校验指标值之间存在差异,则第五日志数据组与其余两个日志数据组均存在差异,将该第五日志数据组作为待异常诊断日志。
120、提取所述待异常诊断日志中满足一致性规则的待定位日志。
在本实施例中,异常诊断服务器对所述待异常诊断日志进行一致性规则检验,并提取所述待异常诊断日志中满足一致性规则的待定位日志。
在本实施例中,在获取待异常诊断日志之后,并不能直接确定待异常诊断日志中一定包括有异常日志。
举例而言,当对来源于两个数据平台的两个日志数据组,进行异常检验并获取第一日志数据组和第二日志数据组作为待异常诊断日志后,只有在确定第一日志数组与第二日志数组之间具有相同的比对条件时,才可以确定待异常诊断日志中包括有异常日志。而在一些特殊情况下,例如,第一日志数组与第二日志数组不是针对同一产品(百度音乐或者百度音乐中某一首歌曲)或者同一类型的操作(例如,搜索类、下载类或者试听类)所产生的产品日志,由于二者不具有相同比对条件,则不能确定待异常诊断日志中一定包括有异常日志,只有将第一日志数组与第二日志数组之间设置为相同的比对条件后重新进行异常检验,才能进而确定待异常诊断日志中是否包括有异常日志。
根据不同的实际情况,待异常定位日志中可能根本不包括异常日志,或者仅仅是待异常定位日志中的部分日志中包括有异常日志,为了提高异常日志的定位效率以及定位准确性,在本实施例中,异常诊断服务器需要提取所述待异常诊断日志中满足一致性规则的待定位日志后,才会进一步定位其中的异常日志。
其中,待定位日志具体为待异常诊断日志中包括有异常日志的产品日志。异常诊断服务器通过对待定位日志进行异常定位,即可以获取其中的异常日志。
其中,一致性规则具体为:用于确定待异常诊断日志是否包括有待定位日志而设定的比对条件,例如,过滤规则的一致性比对、数据源标识的一致性比对或者产品日志生成环境的一致性比对等,对此并不进行限制。其中,如果所述待异常诊断日志为来源于至少两个数据平台的至少两个日志数据组,所述一致性规则检验具体可以包括:过滤规则的一致性检验和数据源标识的一致性检验等,对此并不进行限制。
更具体的,过滤规则的一致性检验具体可以包括:确定该至少两个日志数据组是否均过滤爬虫日志或者静态资源请求日志,或者确定该至少两个日志数据组的PV(PageView,页面浏览量或点击量)或者UV(Unique Visitor,独立访客)过滤规则是否一致等;数据源标识的一致性检验具体可以包括:确定该至少两个日志数据组的数据来源是否相同,例如,是否均为点击日志或者浏览日志等。
其中,如果所述待异常诊断日志为来源于同一目标数据平台的待异常诊断日志,所述一致性规则检验具体可以包括:确定在待异常诊断日志所确定的时间区间内,该目标数据平台的过滤规则是否改变以及确定在待异常诊断日志所确定的时间区间内,是否***是否上线了与该异常诊断日志相关联的产品功能等,对比并不进行限制。
130、基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
一般来说,产品日志中包括有很多有价值的字段参数,例如,用户IP(InternetProtocol,网际协议)、PID(Product IDentity,产品标识)、渠道以及时间等字段参数。
在本实施例中,异常诊断服务器将产品日志中的一个或者多个字段参数作为统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
其中,异常日志具体为在对产品日志进行异常诊断过程中,引起异常的产品日志,产品开发人员或者测试人员通过分析异常日志,可以完成对产品日志的异常诊断。
其中,如果所述待异常诊断日志为来源于至少两个数据平台的至少两个日志数据组,基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志可以具体包括:
使用至少一个设定统计维度对所述至少两个日志数据组进行分维度统计,以统计所述日志数据组中,所述设定统计维度下与统计维度值对应的设定指标值;针对同一统计维度值,如果至少两个日志数据组的设定指标值之间存在差异,获取与该日志数据组对应的数据平台中与该统计维度值对应的产品日志作为异常日志。
其中,如果所述待异常诊断日志为来源于同一目标数据平台的待异常诊断日志,基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志可以具体包括:
使用至少一个设定统计维度,对所述待定位日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;将统计后的待定位日志按所述设定指标值从大到小的顺序进行排序,并按照排序结果获取预定个数的统计维度值;在目标日志数据平台中获取与所述预定个数的统计维度值对应的产品日志,作为异常日志。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
第二实施例
图2是本发明第二实施例的一种产品日志的异常诊断方法流程图。本实施例以上述实施例为基础进行优化,在本实施例中,优选的将操作获取对产品日志进行异常检验后的待异常诊断日志优化为:获取对产品日志进行异常检验后来源于至少两个数据平台的至少两个日志数据组,作为待异常诊断日志;
优选的将操作基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志优化为:使用至少一个设定统计维度对所述至少两个日志数据组进行分维度统计,以统计所述日志数据组中,所述设定统计维度下与统计维度值对应的设定指标值;针对同一统计维度值,如果至少两个日志数据组的设定指标值之间存在差异,获取与该日志数据组对应的数据平台中与该统计维度值对应的产品日志作为异常日志;
优选的将操作提取所述待异常诊断日志中满足一致性规则的待定位日志优化为:获取与所述至少两个日志数据组对应的过滤规则;如果与日志数据组对应的过滤规则相同,将基本过滤规则相同的日志数据组作为所述待定位日志;否则,按照补充过滤规则从数据平台中重新获取日志数据组,并重新进行异常检验:如果重新进行异常检验的检验结果为异常消失,将过滤规则不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述待定位日志。
相应的,本实施例的方法包括如下操作:
210、获取对产品日志进行异常检验后来源于至少两个数据平台的至少两个日志数据组,作为待异常诊断日志。
220、获取与所述至少两个日志数据组对应的过滤规则。
在本实施例中,可以通过人为判断与所述至少两个日志数据组对应的代码逻辑的方式来获取对应的过滤规则,也可以通过异常诊断服务器SQL(Structured QueryLanguage,结构化查询语音)自动进行代码解析的方式来获取对应的过滤规则,对此并不进行限制。
230、判断与日志数据组对应的过滤规则是否相同:若是,执行240;否则,执行250。
在本实施例中,异常诊断服务器通过对待异常诊断日志进行过滤规则的一致性检验,来获取其中的待定位日志。
在本实施例中,针对异常诊断服务器判断与日志数据组对应的过滤规则是否相同的不同判断结果,对应于以下不同处理方式:
如果异常诊断服务器判断与至少两个日志数据组对应的过滤规则均不同,可以选择与其中任何一个日志数据组对应的过滤规则作为补充过滤规则,另外的日志数据组对应的数据平台使用该补充过滤规则重新获取产品日志后,重新将这至少两个日志数据组进行异常检验;
如果异常诊断服务器判断所述至少两个日志数据组中同时具有过滤规则相同和过滤规则不同的日志数据组(例如,待异常诊断日志中包括三个日志数据组,其中两个日志数据组的过滤规则相同,而第三个日志数据组与这两个日志数据组的过滤规则不同),可以将该相同过滤规则作为基本过滤规则,并直接将基本过滤规则相同的日志数据组作为待定位日志。之后将该相同的过滤规则作为补充过滤规则,过滤规则不同的日志数据组对应的数据平台使用该补充规则重新获取产品日志后,重新与上述待定位日志进行异常检验;
如果异常诊断服务器判断所述至少两个日志数据组中包括有与不同过滤规则分别对应相等的至少两个日志数据组(例如,待异常诊断日志中包括四个日志数据组,其中两个日志数据组的过滤规则相同,其中另两个日志数据组的过滤规则相同),可以将上述不同的过滤规则分别作为基本过滤规则,并获取基本过滤规则相同的日志数据组作为待定位日志。
240、将基本过滤规则相同的日志数据组作为待定位日志,执行290。
250、按照补充过滤规则从数据平台中重新获取日志数据组,并重新进行异常检验,执行260。
260、判断重新进行异常检验的检验结果是否为异常消失:若是,执行270;否则,执行280。
270、将过滤规则不一致作为产品日志的异常诊断结果,结束流程。
举例而言,对第一数据平台和第二数据平台进行产品日志异常检验后,发现存在异常(例如,通过比对两个数据平台中的产品日志,得到在2014.8.8这一天针对平凡之路这首歌的播放量存在异常),获取第一数据平台在2014.8.8这一天的全部产品日志作为第一日志数据组,获取第二数据平台在2014.8.8这一天的全部产品日志作为第二日志数据组,比对第一日志数据组和第二日志数据组的过滤规则,发现在计算播放量时,第一数据平台采用的过滤规则为“type=playstart”,而第二数据平台采用的过滤规则为“type=play100ms”,两者不同,将第二数据平台中产品日志的过滤规则修改为“type=playstart”后,重新与第一数据平台的产品日志进行异常检验,如果异常消失,则将“计算播放量的过滤规则不一致”作为异常检验结果进行记录,并结束异常诊断流程。
280、将重新获取的日志数据组,作为所述待定位日志,执行290。
290、使用至少一个设定统计维度对所述至少两个日志数据组进行分维度统计,以统计所述日志数据组中,所述设定统计维度下与统计维度值对应的设定指标值。
在本实施例中,设定统计维度可以为用户IP(Internet Protocol,网际协议)、PID(Product IDentity,产品标识)、渠道以及时间等产品日志中的参数字段,对此并不进行限制。
举例而言,异常诊断服务器使用用户IP作为设定统计维度对两个日志数据组(第一日志数据组和第二日志数据组)进行分维度统计,以统计与不同用户IP对应的PV值,统计结果如表1所示。
表1
2100、针对同一统计维度值,判断至少两个日志数据组的设定指标值之间是否存在差异:若是,执行2110;否则,返回2100。
如表1所示,对于用户IP为132.11.43.2的统计维度值,第一日志数据组的PV值为121,第二日志数据组的PV值为104,两者之间存在差异。
2110、获取与该日志数据组对应的数据平台中与该统计维度值对应的产品日志作为异常日志,以完成对产品日志的异常诊断。
如前所述,异常诊断服务器可以在第一日志数据和第二日志数据分别对应的数据平台中,获取与用户IP为132.11.43.2对应的产品日志作为异常日志,以完成对产品日志的异常诊断。
举例而言,通过分析获取的第一数据平台和第二数据平台中,与132.11.43.2对应的全部产品日志后发现,产生异常的原因是因为第二数据平台的异常日志中存在有特殊的分隔符“\t”,影响第二数据平台中产品日志的存储,导致PV值减少,进而可以完成对产品日志的异常诊断。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
在上述各实施例的基础上,获取与所述至少两个日志数据组对应的过滤规则优选可以包括:在所述至少两个数据平台中,获取与所述至少两个日志数据组对应的过滤规则的SQL程序代码;对获取的所述SQL程序代码进行代码解析,基于设定关键词搜索过滤条件语句;将搜索到的过滤条件语句作为与所述至少两个日志数据组对应的过滤规则。
其中,在本优选实施方式中,设定关键词具体可以包括:where和/或case when。
这样设置的好处是:解决了人为判断代码逻辑来获取过滤规则时带来的过滤规则获取不全面且有遗漏的技术问题,极大的降低了在产品日志的异常诊断过程中的人为参与,进一步的提高了异常诊断的效率。
在上述各实施例的基础上,在基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志之后,还包括:
将所述待定位日志中的异常日志,按照设定的统计维度提供给用户。
在本优选实施方式中,异常诊断服务器将所述待定位日志中的异常日志,按照设定的统计维度提供给用户。
这样设置的好处是:用户可以基于异常诊断服务器按照设定的统计维度所提供的异常日志,便捷、有效的进行异常诊断。
第三实施例
图3是本发明第三实施例的一种产品日志的异常诊断方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,优选的将操作提取所述待异常诊断日志中满足一致性规则的待定位日志优化为:获取与所述至少两个日志数据组对应的数据源标识;如果与日志数据组对应的数据源标识相同,将基本数据源标识相同的日志数据组作为第一日志;否则,按照补充数据源标识重新从数据平台中获取日志数据组,并重新进行异常检验:如果重新进行异常检验的检验结果为异常消失,则将数据源标识不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述第一日志;提取所述第一日志中满足过滤规则一致性的待定位日志。
相应的,本实施例的方法包括如下操作:
310、获取对产品日志进行异常检验后来源于至少两个数据平台的至少两个日志数据组,作为待异常诊断日志。
320、获取与所述至少两个日志数据组对应的数据源标识。
在本实施例中,异常诊断服务器首先提取待诊断异常定位日志数据中满足数据源标识信息一致性的第一日志数据;
之后再提取所述第一日志数据中满足过滤规则一致性的待定位日志数据。
其中,各个产品日志中记录有与产品日志对应的数据源标识类型,例如:点击日志、浏览日志、下载日志或者查询日志等。异常诊断服务器可以通过提取产品日志中特定的字段内容,来获取所述数据源标识类型。
330、判断与日志数据组对应的数据源标识是否相同:若是,执行340;否则,执行350。
在本实施例中,针对异常诊断服务器判断与日志数据组对应的数据源标识是否相同的不同判断结果,对应于以下不同处理方式:
如果异常诊断服务器判断与至少两个日志数据组对应的数据源标识均不同,可以选择与其中任何一个日志数据组对应的数据源标识作为补充数据源标识,另外的日志数据组对应的数据平台使用该补充数据源标识重新获取产品日志后,重新将这至少两个日志数据组进行异常检验;
如果异常诊断服务器判断所述至少两个日志数据组中同时具有数据源标识相同和数据源标识不同的日志数据组(例如,待异常诊断日志中包括三个日志数据组,其中两个日志数据组的数据源标识相同,而第三个日志数据组与这两个日志数据组的数据源标识不同),可以将该相同数据源标识作为基本数据源标识,并直接将基本数据源标识相同的日志数据组作为第一日志。之后将该相同的数据源标识作为补充数据源标识,数据源标识不同的日志数据组对应的数据平台使用该补充数据源标识重新获取产品日志后,重新与上述第一日志进行异常检验;
如果异常诊断服务器判断所述至少两个日志数据组中包括有与不同数据源标识分别对应相等的至少两个日志数据组(例如,待异常诊断日志中包括四个日志数据组,其中两个日志数据组的数据源标识相同,其中另两个日志数据组的数据源标识相同),可以将上述不同的数据源标识分别作为基本数据源标识,并获取基本数据源标识相同的日志数据组作为第一日志。
340、将基本数据源标识相同的日志数据组作为第一日志,执行390。
350、按照补充数据源标识重新从数据平台中获取日志数据组,并重新进行异常检验。
360、判断重新进行异常检验的检验结果是否为异常消失:若是,执行370;否则,执行380。
370、将数据源标识不一致作为产品日志的异常诊断结果,结束流程。
380、将重新获取的日志数据组,作为所述第一日志。
390、获取与所述至少两个第一日志对应的过滤规则。
3100、判断与第一日志对应的过滤规则是否相同:若是,执行3110;否则,执行3120。
3110、将基本过滤规则相同的第一日志作为待定位日志,执行3160。
3120、按照补充过滤规则从数据平台中重新获取日志数据组,并重新进行异常检验,执行3130。
3130、判断重新进行异常检验的检验结果是否为异常消失:若是,执行3140;否则,执行3150。
3140、将过滤规则不一致作为产品日志的异常诊断结果,结束流程。
3150、将重新获取的日志数据组,作为所述待定位日志,执行3160。
3160、基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
第四实施例
图4是本发明第四实施例的一种产品日志的异常诊断方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,优选的将操作获取对产品日志进行异常检验后的待异常诊断日志优化为:获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志;
优选的将操作基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志优化为:使用至少一个设定统计维度,对所述待定位日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;将统计后的待定位日志按所述设定指标值从大到小的顺序进行排序,并按照排序结果获取预定个数的统计维度值;在目标日志数据平台中获取与所述预定个数的统计维度值对应的产品日志,作为异常日志。
相应的,本实施例的方法包括如下操作:
410、获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志。
420、提取所述待异常诊断日志中满足一致性规则的待定位日志。
430、使用至少一个设定统计维度,对所述待定位日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值。
440、将统计后的待定位日志按所述设定指标值从大到小的顺序进行排序,并按照排序结果获取预定个数的统计维度值。
450、在目标日志数据平台中获取与所述预定个数的统计维度值对应的产品日志,作为异常日志,以完成对产品日志的异常诊断。
举例而言,异常诊断服务器使用用户IP作为设定统计维度对待定位日志进行分维度统计,以统计与不同用户IP对应的PV值,并将统计结果按照从大到小的顺序进行排序,排序结果如表2所示。
表2
一般来说,异常数据会以很大的概率出现在与较大设定指标值对应的统计维度值所在的产品日志中。在本实施例中,异常诊断服务器将统计结果按照从大到小的顺序进行排序后,获取与预定个数(例如,3个、4个或者5个等)的统计维度值对应的产品日志,作为异常日志。
举例而言,异常诊断服务器获取目标数据平台中,与排序后的前5个PV值的用户IP对应的产品日志,作为异常日志。
在本实施例中,如果设定分组维度为用户IP时,可以根据异常日志判断是否有同一IP进行刷榜的行为(同一IP反复点击或者下载同一歌曲的行为);如果设定分组维度为访问途径(直接输入网址访问,或者从其他网站入口导流进行的访问等),可以根据异常日志判断用户群来源分布是否有某个来源异常等,进而完成对产品日志的异常诊断。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
第五实施例
图5是本发明第五实施例的一种产品日志的异常诊断方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,优选的将操作基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志优化为:在参考数据平台的产品日志中,获取与待定位日志相对应的参考日志;计算与所述参考日志和所述待定位日志分别对应的校验指标值;如果与所述待定位日志和所述参考日志分别对应的校验指标值之间存在差异,使用至少一个设定统计维度对所述待定位日志和所述参考日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;针对同一统计维度值,如果统计后的待定位日志和参考日志的设定指标值之间存在差异,分别获取目标数据平台和参考数据平台中与所述统计维度值对应的产品日志,作为异常日志。
相应的,本实施例的方法包括如下操作:
510、获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志。
520、提取所述待异常诊断日志中满足一致性规则的待定位日志。
530、在参考数据平台的产品日志中,获取与待定位日志相对应的参考日志。
在本实施例中,异常诊断服务器在获取来源于同一目标数据平台的待定位日志之后,在进行异常定位前,不是向第四实施例那样,考虑异常原因有该目标数据平台的异常日志引起的,而是考虑异常原因是由不同数据平台的数据差异性引起的。
在本实施例中,异常诊断服务器根据来源于目标数据平台的待异常诊断日志,获取在参考数据平台的产品日志中,获取与待定位日志相对应的参考日志。
例如,如果待异常诊断日志为第一数据平台在2014.8.88:00:00-9:00:00这个时间段的产品日志,可以选择第二数据平台在2014.8.88:00:00-9:00:00这个时间段的产品日志作为参考日志。
540、计算与所述参考日志和所述待定位日志分别对应的校验指标值。
550、判断与所述待定位日志和所述参考日志分别对应的校验指标值之间是否存在差异:若是,执行560;否则,执行570。
560、使用至少一个设定统计维度对所述待定位日志和所述参考日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值,执行580。
570、结束流程。
580、针对同一统计维度值,判断统计后的待定位日志和参考日志的设定指标值之间是否存在差异:若是,执行590;否则,返回580。
590、分别获取目标数据平台和参考数据平台中与所述统计维度值对应的产品日志,作为异常日志。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
第六实施例
图6是本发明第六实施例的一种产品日志的异常诊断方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,优选的将操作提取所述待异常诊断日志中满足一致性规则的待定位日志优化为:如果在所述待异常诊断日志所确定的时间区间内,目标数据平台的过滤规则未被修改,将来源于目标数据平台的待异常诊断日志作为所述待定位日志;否则,恢复过滤规则重新从目标数据平台中获取产品日志,并重新进行异常检验;如果重新进行异常检验的检验结果为异常消失,则将修改过滤规则作为产品日志的异常诊断结果;否则,将重新获取的产品日志,作为所述待定位日志。
相应的,本实施例的方法包括如下操作:
610、获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志。
620、判断在所述待异常诊断日志所确定的时间区间内,目标数据平台的过滤规则是否被修改:若是,执行630;否则,执行640。
630、恢复过滤规则重新从目标数据平台中获取产品日志,并重新进行异常检验,执行650;
640、将来源于目标数据平台的待异常诊断日志作为所述待定位日志,执行680。
650、判断重新进行异常检验的检验结果是否为异常消失:若是,执行660;否则,执行670。
660、将修改过滤规则作为产品日志的异常诊断结果,结束流程。
670、将重新获取的产品日志,作为所述待定位日志,执行680。
680、基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
第七实施例
图7是本发明第七实施例的一种产品日志的异常诊断方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,优选的将操作提取所述待异常诊断日志中满足一致性规则的待定位日志数据优化为:提取所述待异常诊断日志中满足过滤规则一致性的第一日志;如果在第一日志所确定的时间区间内,***上线了与所述第一日志相关联的产品功能,将上线新的产品功能作为产品日志的异常诊断结果;否则,将所述第一日志作为所述待定位日志。
710、获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志。
720、判断在所述待异常诊断日志所确定的时间区间内,目标数据平台的过滤规则是否被修改:若是,执行630;否则,执行640。
730、恢复过滤规则重新从目标数据平台中获取产品日志,并重新进行异常检验,执行750;
740、将来源于目标数据平台的待异常诊断日志作为第一日志,执行780。
750、判断重新进行异常检验的检验结果是否为异常消失:若是,执行760;否则,执行770。
760、将修改过滤规则作为产品日志的异常诊断结果,结束流程。
770、将重新获取的产品日志,作为所述第一日志,执行780。
780、判断在第一日志所确定的时间区间内,***是否上线了与所述第一日志相关联的产品功能:若是,执行790;否则,执行7100。
790、将上线新的产品功能作为产品日志的异常诊断结果,结束流程。
7100、将所述第一日志作为所述待定位日志,执行7110。
7110、基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
第八实施例
在图8中示出了本发明第八实施例的一种产品日志的异常诊断装置的结构图。如图8所示,所述装置包括:
待异常诊断日志获取单元81,用于获取对产品日志进行异常检验后的待异常诊断日志。
待定位日志提取单元82,用于提取所述待异常诊断日志中满足一致性规则的待定位日志。
异常日志定位单元83,用于基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断。
本发明实施例通过获取对产品日志信息进行异常检验后的待诊断异常诊断日志数据;提取所述待诊断异常定位日志数据中满足一致性规则的待定位日志数据;基于设定统计维度对所述待定位日志数据进行分维度统计,并根据统计结果定位所述待定位日志数据中的异常日志数据,以完成对产品日志的异常诊断的技术手段,优化了现有的产品日志诊断技术,满足了人们日益增长的高效化、便捷化的产品日志的异常诊断需求,极大的提高了异常诊断人员的工作效率,减少了人力成本的投入。
在上述各实施例的基础上,所述待异常诊断日志获取单元可以用于:
获取对产品日志进行异常检验后来源于至少两个数据平台的至少两个日志数据组,作为待异常诊断日志。
在上述各实施例的基础上,所述异常日志定位单元具体可以用于:
使用至少一个设定统计维度对所述至少两个日志数据组进行分维度统计,以统计所述日志数据组中,所述设定统计维度下与统计维度值对应的设定指标值;针对同一统计维度值,如果至少两个日志数据组的设定指标值之间存在差异,获取与该日志数据组对应的数据平台中与该统计维度值对应的产品日志作为异常日志。
在上述各实施例的基础上,待定位日志提取单元可以包括:
过滤规则获取子单元,用于获取与所述至少两个日志数据组对应的过滤规则;第一定位日志提取子单元,用于如果与日志数据组对应的过滤规则相同,将基本过滤规则相同的日志数据组作为所述待定位日志;否则,按照补充过滤规则从数据平台中重新获取日志数据组,并重新进行异常检验:第二定位日志提取子单元,用于如果重新进行异常检验的检验结果为异常消失,将过滤规则不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述待定位日志。
在上述各实施例的基础上,所述过滤规则获取子单元具体可以用于:
在所述至少两个数据平台中,获取与所述至少两个日志数据组对应的过滤规则的SQL程序代码;对获取的所述SQL程序代码进行代码解析,基于设定关键词搜索过滤条件语句;将搜索到的过滤条件语句作为与所述至少两个日志数据组对应的过滤规则。
在上述各实施例的基础上,所述待定位日志提取单元可以用于:
获取与所述至少两个日志数据组对应的数据源标识;如果与日志数据组对应的数据源标识相同,将基本数据源标识相同的日志数据组作为第一日志;否则,按照补充数据源标识重新从数据平台中获取日志数据组,并重新进行异常检验:如果重新进行异常检验的检验结果为异常消失,则将数据源标识不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述第一日志;提取所述第一日志中满足过滤规则一致性的待定位日志。
在上述各实施例的基础上,所述待异常诊断日志获取单元可以用于:
获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志。
在上述各实施例的基础上,所述异常日志定位单元具体可以用于:
使用至少一个设定统计维度,对所述待定位日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;将统计后的待定位日志按所述设定指标值从大到小的顺序进行排序,并按照排序结果获取预定个数的统计维度值;在目标日志数据平台中获取与所述预定个数的统计维度值对应的产品日志,作为异常日志。
在上述各实施例的基础上,所述异常日志定位单元具体可以用于:
在参考数据平台的产品日志中,获取与待定位日志相对应的参考日志;计算与所述参考日志和所述待定位日志分别对应的校验指标值;如果与所述待定位日志和所述参考日志分别对应的校验指标值之间存在差异,使用至少一个设定统计维度对所述待定位日志和所述参考日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;针对同一目标统计维度值,如果统计后的待定位日志和参考日志的设定指标值之间存在差异,分别获取目标数据平台和参考数据平台中与所述目标统计维度值对应的产品日志,作为异常日志。
在上述各实施例的基础上,所述待定位日志提取单元可以用于:
如果在所述待异常诊断日志所确定的时间区间内,目标数据平台的过滤规则未被修改,将来源于目标数据平台的待异常诊断日志作为所述待定位日志;否则,恢复过滤规则重新从目标数据平台中获取产品日志,并重新进行异常检验;如果重新进行异常检验的检验结果为异常消失,则将修改过滤规则作为产品日志的异常诊断结果;否则,将重新获取的产品日志,作为所述待定位日志。
在上述各实施例的基础上,所述待定位日志提取单元可以用于:
提取所述待异常诊断日志中满足过滤规则一致性的第一日志;如果在第一日志所确定的时间区间内,***上线了与所述第一日志相关联的产品功能,将上线新的产品功能作为产品日志的异常诊断结果;否则,将所述第一日志作为所述待定位日志。
本发明实施例所提供的产品日志的异常诊断装置可用于执行本发明任意实施例提供的产品日志的异常诊断方法,具备相应的功能模块,实现相同的有益效果。
显然,本领域技术人员应该明白,上述的本发明的各模块或各步骤可以通过如上所述的服务器实施。可选地,本发明实施例可以用计算机装置可执行的程序来实现,从而可以将它们存储在存储装置中由处理器来执行,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等;或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种产品日志的异常诊断方法,其特征在于,包括:
获取对产品日志进行异常检验后的待异常诊断日志;
提取所述待异常诊断日志中满足一致性规则的待定位日志,所述一致性规则为用于确定所述待异常诊断日志是否包括有所述待定位日志而设定的比对条件,所述比对条件包括过滤规则的一致性、数据源标识的一致性和产品日志生成环境的一致性中的至少一种;
基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断;
其中,获取对产品日志进行异常检验后的待异常诊断日志包括:
完成对来源于不同数据平台的产品日志之间的异常检验;
完成对来源于同一数据平台的不同时间区间的产品日志之间的异常检验;
其中,基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志具体包括:
在参考数据平台的产品日志中,获取与待定位日志相对应的参考日志;
计算与所述参考日志和所述待定位日志分别对应的校验指标值;
如果与所述待定位日志和所述参考日志分别对应的校验指标值之间存在差异,使用至少一个设定统计维度对所述待定位日志和所述参考日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;
针对同一统计维度值,如果统计后的待定位日志和参考日志的设定指标值之间存在差异,分别获取目标数据平台和参考数据平台中与所述统计维度值对应的产品日志,作为异常日志。
2.根据权利要求1所述的方法,其特征在于,获取对产品日志进行异常检验后的待异常诊断日志包括:
获取对产品日志进行异常检验后来源于至少两个数据平台的至少两个日志数据组,作为待异常诊断日志。
3.根据权利要求2所述的方法,其特征在于,基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志具体包括:
使用至少一个设定统计维度对所述至少两个日志数据组进行分维度统计,以统计所述日志数据组中,所述设定统计维度下与统计维度值对应的设定指标值;
针对同一统计维度值,如果至少两个日志数据组的设定指标值之间存在差异,获取与该日志数据组对应的数据平台中与该统计维度值对应的产品日志作为异常日志。
4.根据权利要求2所述的方法,其特征在于,提取所述待异常诊断日志中满足一致性规则的待定位日志包括:
获取与所述至少两个日志数据组对应的过滤规则;
如果与日志数据组对应的过滤规则相同,将基本过滤规则相同的日志数据组作为所述待定位日志;否则,按照补充过滤规则从数据平台中重新获取日志数据组,并重新进行异常检验:
如果重新进行异常检验的检验结果为异常消失,将过滤规则不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述待定位日志。
5.根据权利要求4所述的方法,其特征在于,获取与所述至少两个日志数据组对应的过滤规则具体包括:
在所述至少两个数据平台中,获取与所述至少两个日志数据组对应的过滤规则的结构化查询语言SQL程序代码;
对获取的所述SQL程序代码进行代码解析,基于设定关键词搜索过滤条件语句;
将搜索到的过滤条件语句作为与所述至少两个日志数据组对应的过滤规则。
6.根据权利要求2所述的方法,其特征在于,提取所述待异常诊断日志中满足一致性规则的待定位日志包括:
获取与所述至少两个日志数据组对应的数据源标识;
如果与日志数据组对应的数据源标识相同,将基本数据源标识相同的日志数据组作为第一日志;否则,按照补充数据源标识重新从数据平台中获取日志数据组,并重新进行异常检验:
如果重新进行异常检验的检验结果为异常消失,则将数据源标识不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述第一日志;
提取所述第一日志中满足过滤规则一致性的待定位日志。
7.根据权利要求1所述的方法,其特征在于,获取对产品日志进行异常检验后的待异常诊断日志包括:
获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志。
8.根据权利要求7所述的方法,其特征在于,基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志具体包括:
使用至少一个设定统计维度,对所述待定位日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;
将统计后的待定位日志按所述设定指标值从大到小的顺序进行排序,并按照排序结果获取预定个数的统计维度值;
在目标日志数据平台中获取与所述预定个数的统计维度值对应的产品日志,作为异常日志。
9.根据权利要求7所述的方法,其特征在于,提取所述待异常诊断日志中满足一致性规则的待定位日志包括:
如果在所述待异常诊断日志所确定的时间区间内,目标数据平台的过滤规则未被修改,将来源于目标数据平台的待异常诊断日志作为所述待定位日志;否则,恢复过滤规则重新从目标数据平台中获取产品日志,并重新进行异常检验;
如果重新进行异常检验的检验结果为异常消失,则将修改过滤规则作为产品日志的异常诊断结果;否则,将重新获取的产品日志,作为所述待定位日志。
10.根据权利要求7所述的方法,其特征在于,提取所述待异常诊断日志中满足一致性规则的待定位日志数据包括:
提取所述待异常诊断日志中满足过滤规则一致性的第一日志;
如果在第一日志所确定的时间区间内,***上线了与所述第一日志相关联的产品功能,将上线新的产品功能作为产品日志的异常诊断结果;否则,将所述第一日志作为所述待定位日志。
11.一种产品日志的异常诊断装置,其特征在于,包括:
待异常诊断日志获取单元,用于获取对产品日志进行异常检验后的待异常诊断日志;
待定位日志提取单元,用于提取所述待异常诊断日志中满足一致性规则的待定位日志,所述一致性规则为用于确定所述待异常诊断日志是否包括有所述待定位日志而设定的比对条件,所述比对条件包括过滤规则的一致性、数据源标识的一致性和产品日志生成环境的一致性中的至少一种;
异常日志定位单元,用于基于设定统计维度对所述待定位日志进行分维度统计,并根据统计结果定位所述待定位日志中的异常日志,以完成对产品日志的异常诊断;
其中,获取对产品日志进行异常检验后的待异常诊断日志包括:
完成对来源于不同数据平台的产品日志之间的异常检验;
完成对来源于同一数据平台的不同时间区间的产品日志之间的异常检验;
所述异常日志定位单元具体用于:
在参考数据平台的产品日志中,获取与待定位日志相对应的参考日志;
计算与所述参考日志和所述待定位日志分别对应的校验指标值;
如果与所述待定位日志和所述参考日志分别对应的校验指标值之间存在差异,使用至少一个设定统计维度对所述待定位日志和所述参考日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;
针对同一目标统计维度值,如果统计后的待定位日志和参考日志的设定指标值之间存在差异,分别获取目标数据平台和参考数据平台中与所述目标统计维度值对应的产品日志,作为异常日志。
12.根据权利要求11所述的装置,其特征在于,所述待异常诊断日志获取单元用于:
获取对产品日志进行异常检验后来源于至少两个数据平台的至少两个日志数据组,作为待异常诊断日志。
13.根据权利要求12所述的装置,其特征在于,所述异常日志定位单元具体用于:
使用至少一个设定统计维度对所述至少两个日志数据组进行分维度统计,以统计所述日志数据组中,所述设定统计维度下与统计维度值对应的设定指标值;
针对同一统计维度值,如果至少两个日志数据组的设定指标值之间存在差异,获取与该日志数据组对应的数据平台中与该统计维度值对应的产品日志作为异常日志。
14.根据权利要求12所述的装置,其特征在于,待定位日志提取单元包括:
过滤规则获取子单元,用于获取与所述至少两个日志数据组对应的过滤规则;
第一定位日志提取子单元,用于如果与日志数据组对应的过滤规则相同,将基本过滤规则相同的日志数据组作为所述待定位日志;否则,按照补充过滤规则从数据平台中重新获取日志数据组,并重新进行异常检验:
第二定位日志提取子单元,用于如果重新进行异常检验的检验结果为异常消失,将过滤规则不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述待定位日志。
15.根据权利要求12所述的装置,其特征在于,所述待定位日志提取单元用于:
获取与所述至少两个日志数据组对应的数据源标识;
如果与日志数据组对应的数据源标识相同,将基本数据源标识相同的日志数据组作为第一日志;否则,按照补充数据源标识重新从数据平台中获取日志数据组,并重新进行异常检验:
如果重新进行异常检验的检验结果为异常消失,则将数据源标识不一致作为产品日志的异常诊断结果;否则,将重新获取的日志数据组,作为所述第一日志;
提取所述第一日志中满足过滤规则一致性的待定位日志。
16.根据权利要求11所述的装置,其特征在于,所述待异常诊断日志获取单元用于:
获取对产品日志进行异常检验后来源于目标数据平台的待异常诊断日志。
17.根据权利要求16所述的装置,其特征在于,所述异常日志定位单元具体用于:
使用至少一个设定统计维度,对所述待定位日志进行分维度统计,以统计所述设定统计维度下与统计维度值对应的设定指标值;
将统计后的待定位日志按所述设定指标值从大到小的顺序进行排序,并按照排序结果获取预定个数的统计维度值;
在目标日志数据平台中获取与所述预定个数的统计维度值对应的产品日志,作为异常日志。
18.根据权利要求16所述的装置,其特征在于,所述待定位日志提取单元用于:
如果在所述待异常诊断日志所确定的时间区间内,目标数据平台的过滤规则未被修改,将来源于目标数据平台的待异常诊断日志作为所述待定位日志;否则,恢复过滤规则重新从目标数据平台中获取产品日志,并重新进行异常检验;
如果重新进行异常检验的检验结果为异常消失,则将修改过滤规则作为产品日志的异常诊断结果;否则,将重新获取的产品日志,作为所述待定位日志。
CN201410461063.7A 2014-09-11 2014-09-11 产品日志的异常诊断方法和装置 Active CN104268064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410461063.7A CN104268064B (zh) 2014-09-11 2014-09-11 产品日志的异常诊断方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410461063.7A CN104268064B (zh) 2014-09-11 2014-09-11 产品日志的异常诊断方法和装置

Publications (2)

Publication Number Publication Date
CN104268064A CN104268064A (zh) 2015-01-07
CN104268064B true CN104268064B (zh) 2018-03-27

Family

ID=52159587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410461063.7A Active CN104268064B (zh) 2014-09-11 2014-09-11 产品日志的异常诊断方法和装置

Country Status (1)

Country Link
CN (1) CN104268064B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294529A (zh) * 2015-06-29 2017-01-04 阿里巴巴集团控股有限公司 一种识别用户异常操作方法和设备
CN106326278A (zh) * 2015-06-30 2017-01-11 阿里巴巴集团控股有限公司 一种判断数据异常方法和设备
CN105183912B (zh) * 2015-10-12 2019-03-01 北京百度网讯科技有限公司 异常日志确定方法和装置
CN105653730B (zh) * 2016-02-01 2019-07-09 中国农业银行股份有限公司 一种数据质量的检验方法及装置
CN108280022B (zh) * 2018-02-08 2022-04-01 无线生活(杭州)信息科技有限公司 性能监测方法及装置
CN110389874B (zh) * 2018-04-20 2021-01-19 比亚迪股份有限公司 日志文件异常检测方法和装置
CN109040110B (zh) * 2018-08-31 2021-10-22 新华三信息安全技术有限公司 一种外发行为检测方法及装置
CN110297846B (zh) * 2019-05-28 2021-08-20 北京奇艺世纪科技有限公司 一种日志特征处理***、方法、电子设备及存储介质
CN110413573B (zh) * 2019-08-02 2022-07-05 中国工商银行股份有限公司 日志存储控制方法、装置、计算机设备和存储介质
CN112579327B (zh) * 2019-09-27 2024-05-14 阿里巴巴集团控股有限公司 一种故障检测方法、装置及设备
CN111552684A (zh) * 2020-04-29 2020-08-18 腾讯科技(深圳)有限公司 异常数据定位方法、装置、计算机设备和存储介质
CN112685277B (zh) * 2020-12-31 2023-01-24 海光信息技术股份有限公司 警告信息检查方法、装置、电子设备和可读存储介质
CN114328147B (zh) * 2021-11-30 2023-12-29 浪潮(山东)计算机科技有限公司 一种测试异常处理方法、装置、电子设备及存储介质
CN115766514A (zh) * 2022-11-02 2023-03-07 中国第一汽车股份有限公司 车联网的全链路质量监控方法、装置、存储介质和车辆

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101325520A (zh) * 2008-06-17 2008-12-17 南京邮电大学 基于日志的智能自适应网络故障定位和分析方法
CN101661423A (zh) * 2009-09-01 2010-03-03 卡斯柯信号有限公司 一种多维日志***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0786841B2 (ja) * 1990-04-25 1995-09-20 株式会社日立製作所 障害情報ログ方法及びデータ処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101325520A (zh) * 2008-06-17 2008-12-17 南京邮电大学 基于日志的智能自适应网络故障定位和分析方法
CN101661423A (zh) * 2009-09-01 2010-03-03 卡斯柯信号有限公司 一种多维日志***

Also Published As

Publication number Publication date
CN104268064A (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
CN104268064B (zh) 产品日志的异常诊断方法和装置
CN105975604B (zh) 一种分布迭代式数据处理程序异常检测与诊断方法
CN110544508B (zh) 一种单基因遗传病基因的分析方法、装置及电子设备
CN105488185B (zh) 一种知识库的优化方法和装置
CN106598741B (zh) 个性化推荐***的分布式a/b测试方法、***及视频推荐***
CN106372225A (zh) 一种基于高价值对比库的信息处理装置及方法
CN108664480A (zh) 一种多数据源用户信息整合方法和装置
WO2018010379A1 (zh) 临床路径自动生成***和方法
Folino et al. A comorbidity-based recommendation engine for disease prediction
CN106446575B (zh) 智能推送医疗资源的方法及***
CN110704583A (zh) 一种病案分析方法、装置、服务器及存储介质
CN114201328A (zh) 基于人工智能的故障处理方法、装置、电子设备及介质
CN114661705A (zh) 一种基于云计算的大数据分析***
CN110019762B (zh) 一种问题定位方法、存储介质和服务器
CN112559504A (zh) 一种基于数据热度的数据清理方法、装置及存储介质
CN111831545A (zh) 测试用例生成方法、生成装置、计算机设备和存储介质
CN109933798B (zh) 一种审计日志分析方法及装置
CN107610783A (zh) 一种脑肿瘤信息平台
CN116627988A (zh) 一种基于规则配置的患者主索引***
CN106407254A (zh) 用户点击行为链的处理方法及装置
Biffl et al. Building Empirical Software Engineering Bodies of Knowledge with Systematic Knowledge Engineering.
CN116756373A (zh) 基于知识图谱更新的项目评审专家筛选方法、***及介质
CN110010231A (zh) 一种数据处理***及计算机可读存储介质
Chen et al. Multi-feature integration for perception-dependent examination-bias estimation
CN111553520B (zh) 基于供应链追溯评价体系的粮食生产优化方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160315

Address after: 100085, Beijing, Haidian District Qinghe Anning East Road No. 23, building two, 18, 2108

Applicant after: BEIJING YINZHIBANG CULTURE TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220523

Address after: 518057 3305, floor 3, building 1, aerospace building, No. 51, Gaoxin South ninth Road, high tech Zone community, Yuehai street, Nanshan District, Shenzhen, Guangdong

Patentee after: Shenzhen Taile Culture Technology Co.,Ltd.

Address before: 2108, floor 2, building 23, No. 18, anningzhuang East Road, Qinghe, Haidian District, Beijing 100085

Patentee before: BEIJING YINZHIBANG CULTURE TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right