关键运行日志提取方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种关键运行日志提取方法及装置。
背景技术
在计算机***中,通常包括有多个功能模块,每个功能模块包括多个操作流程,每个操作流程均包括多个操作步骤,通过执行各个操作步骤,即可以完成整个操作流程,从而可以实现各种***业务。然而,计算机***在实际运行过程中,可能会出现***故障等问题,当出现该类问题时,通常需要进行运维分析。其中,在运维分析过程中,为了能够精确地定位到具体哪个操作流程中的哪个操作步骤出现了故障,需要从各个操作流程执行多个操作步骤后生成的***运行日志中,提取能够反应该多个操作步骤的多条运行日志,这里将该多条运行日志称之为关键运行日志。
在现有技术中,通常是通过统计的方式提取该关键运行日志,其具体实现过程包括:通过遍历的方式,从各个操作流程执行多个操作步骤后生成的***运行日志中,确定指定分词,该指定分词是指在该***运行日志中出现次数最多的分词,之后,确定该指定分词在该***运行日志包括的每条运行日志中出现的次数,并按照出现次数从大到小的顺序,对该***运行日志包括的多条运行日志进行排序,按照从前至后的顺序,从排序后的多条运行日志中选择指定数量的运行日志,并将所选择的运行日志确定为关键运行日志。
然而,上述提供的关键运行日志提取方法中,由于最终得到的关键运行日志是根据指定分词在每条运行日志中出现的次数排序得到,因此,当***故障出现在***运行日志中除该关键运行日志之外的其它运行日志中时,用户则无法准确定位该***故障,即导致影响运维分析效果。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种关键运行日志提取方法及装置。所述技术方案如下:
第一方面,提供了一种关键运行日志提取方法,所述方法包括:
基于目标操作流程标识,从***运行日志中,获取多条目标运行日志,所述***运行日志为执行多个操作流程后生成得到,所述多条目标运行日志为多次执行目标操作流程后重复出现的运行日志;基于多个指定维度和所述多个指定维度的权重,确定所述多条目标运行日志的评估总分值,各个评估总分值用于评估各条目标运行日志能够指示一个操作步骤的能力;基于所述多条目标运行日志的评估总分值,从所述多条目标运行日志中确定所述目标操作流程对应的关键运行日志。
其中,目标操纵流程可以用于唯一标识一个目标操作流程。在该***运行日志中,包括了该目标操作流程对应的关键运行日志,该关键运行日志是指能够反应该目标操作流程中的多个操作步骤的运行日志,在本发明实施例中,基于多个指定维度和该多个指定维度的权重,确定该每条目标运行日志的评估总分值,由于该各个评估总分值用于评估各条目标运行日志能够指示一个操作步骤的能力,因此,基于该评估总分值,即可以确定该目标操作流程对应的关键运行日志。
在本发明实施例中,基于目标操作流程标识,从执行多个操作流程后生成的***运行日志中,获取多次执行目标操作流程后重复出现的多条目标运行日志,之后,基于多个指定维度和该多个指定维度的权重,确定该多条目标运行日志的评估总分值,其中,由于各个评估总分值评估了各条目标运行日志能够指示一个操作步骤的能力,因此,基于该多条目标运行日志的评估总分值,可以从该多条目标运行日志中确定该目标操作流程对应的关键运行日志,即所确定的关键运行日志能够更加精确地反应该目标操作流程中的各个操作步骤,解决了用户无法准确定位***故障的问题,提高了运维分析效果。
结合第一方面,在第一方面的第一种可能的实现方式中,所述基于目标操作流程标识,从***运行日志中,获取多条目标运行日志,包括:
从所述***运行日志中,获取所述目标操作流程标识对应的多条运行日志;将所述多条运行日志中每条运行日志包括的多个指定格式的日志信息替换成多个预设字符,所述多个指定格式与所述多个预设字符一一对应;从替换后的多条运行日志中,选择在多次执行所述目标操作流程后重复出现的多条运行日志;将选择的多条运行日志确定为所述多条目标运行日志。
其中,该多个指定格式的日志信息可以包括日志生成时间、日志编号等。在获取的多条运行日志中,当该多条运行日志中包括多个指定格式的日志信息时,容易影响判断是否是重复出现的日志。因此,在提取关键运行日志之前,处理器110需要将该目标操作流程对应的多条运行日志中的多个指定格式的日志信息进行替换处理,即将该多个指定格式的日志信息替换成多个预设字符,例如,将该多条运行日志中的日志生成时间均替换成TIME(时间),将该多条运行日志中的日志编号均统一替换成ID(Identification,身份标识),用VALUE(值)代替其它指定格式的日志信息。之后,处理器110即可从替换后的多条运行日志中,选择在多次执行该目标操作流程后重复出现的多条运行日志,所选择的多条运行日志即为上述多条目标运行日志。
在本发明实施例中,为了避免该目标运行日志中的多个指定格式的日志信息影响对重复日志的判定,在从***运行日志中获取多条运行日志后,将该多条运行日志中的多个指定格式的日志信息进行统一替换处理,如此,提高了获取多条目标运行日志的准确性。
结合第一方面和第一方面的第一种可能的实现方式中任一可能的实现方式,在第一方面的第二种可能的实现方式中,所述基于多个指定维度和所述多个指定维度的权重,确定所述多条目标运行日志的评估总分值,包括:
对于所述多条目标运行日志中的每条目标运行日志,确定所述目标运行日志在所述多个指定维度上的维度评估分值;确定所述目标运行日志的多个维度评估分值与所述多个指定维度中对应指定维度的权重之间的乘积;将所述目标运行日志的多个维度评估分值与所述多个指定维度中对应指定维度的权重之间的乘积之和确定为所述目标运行日志的评估总分值。
需要说明的是,该每个指定维度对应的权重可以由用户根据实际需求自定义设置,在本发明实施例中,由于日志相似度和前后日志组件变化量衡量一条目标运行日志所占的比重相对比较大一些,因此,可以将日志相似度和前后日志组件变化量对应的权重设置的比较大一些,其它维度对应的权重设置地比较小一些。在确定的多个乘积之后,将该多个乘积相加,即得到该目标运行日志的评估总分值。
在本发明实施例中,通过多个指定维度和多个指定维度的权重,来确定每条目标运行日志的评估总分值,提高了对目标运行日志评估的全面性,从而间接地提高了提取关键运行日志的精确性。
结合第一方面至第一方面的第二种可能的实现方式中任一可能的实现方式,在第一方面的第三种可能的实现方式中,所述多个指定维度包括日志相似度、日志感情色彩、日志动作色彩、前后日志时间差以及前后日志组件变化量中的至少一种。
其中,该日志相似度用于指示该目标运行日志与该多条目标运行日志中的每条目标运行日志之间的相似度,该日志感情色彩用于指示该目标运行日志中所包含的形容词以及副词对应的感情色彩,该日志动作色彩用于指示该目标运行日志中包含的动词、动词过去时和动词进行时对应的感情色彩,该前后日志时间差是指该目标运行日志与前一条目标运行日志之间的时间差,该前后日志组件变化量用于指示该目标运行日志与前一条目标运行日志之间组件标识的变化情况。
在本发明实施例中,上述多个指定维度包括日志相似度、日志感情色彩、日志动作色彩、前后日志时间差以及前后日志组件变化量中的至少一种,提高了对该目标运行日志评估的全面性,从而间接地提高了提取关键运行日志的精确性。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述确定所述目标运行日志在所述多个指定维度上的维度评估分值,包括:
当所述多个指定维度中包括所述日志相似度时,确定所述多条目标运行日志中每条目标运行日志与所述目标运行日志之间的相似度;确定所述多条目标运行日志中与所述目标运行日志之间相似度大于或等于预设阈值的目标运行日志的数量;将所确定的数量与所述日志相似度对应的第一预设分值之间的乘积确定为所述目标运行日志在日志相似度上的维度评估分值。
上述当该多条目标运行日志中的某条目标运行日志与该目标运行日志之间相似度大于或等于预设阈值时,说明该某条目标运行日志与该目标运行日志同属于同一个操作步骤。
在本发明实施例中,通过确定该目标运行日志在该日志相似度上的维度评估分值,确定了该目标运行日志所覆盖的范围,即间接地确定了关键运行日志的覆盖范围。
结合第一方面的第三种可能的实现方式,在第一方面的第五种可能的实现方式中,所述确定所述目标运行日志在所述多个指定维度上的维度评估分值,包括:
当所述多个指定维度中包括所述日志感情色彩时,对所述目标运行日志进行分词处理,得到多个词语;从所述多个词语中选择词性为形容词的词语;确定第一数量,所述第一数量为选择的词语的数量;基于所述第一数量与第二预设分值,确定所述目标运行日志在所述日志感情色彩上的维度评估分值,所述第二预设分值为形容词对应的分值。
上述从该多个词语中选择词性为形容词的词语的具体实现过程可以包括:在该终端的存储器中预先存储有词性为形容词的多个预设词语,终端的处理器将该目标运行日志进行分词处理得到该多个词语后,对于该多个词语中的每个词语,该处理器判断该词语是否属于该多个预设词语,当该词语属于该多个预设词语时,选择该词语,当该词语不属于该多个预设词语时,则不选择该词语。
在本发明实施例中,上述通过确定该目标运行日志在该日志感情色彩上的维度评估分值,确定了该目标运行日志所包括的有用信息,即间接地提高了关键运行日志的实用性。
结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,所述确定第一数量之后,还包括:
确定第二数量,所述第二数量为所述选择的词语中存在与副词相邻的词语的数量;相应地,所述基于所述第一数量与第二预设分值,确定所述目标运行日志在所述日志感情色彩上的维度评估分值,包括:确定所述第一数量与所述第二数量之间的差值;将所述差值与所述第二预设分值相乘,得到第一数值;将所述第二数量、所述第二预设分值和第三预设分值相乘,得到第二数值,所述第三预设分值为副词对应的分值;将所述第一数值和所述第二数值之和确定为所述目标运行日志在所述日志感情色彩上的维度评估分值。
也即是,针对上述确定的多个词性为形容词的词语中的每个词语,处理器判断与该词语相邻的词语的词性是否为副词,如果与该词语相邻的词语的词性为副词,还需要在形容词对应的第二预设分值乘上副词对应的第三预设分值,得到组合分值。
在本发明实施例中,上述通过确定该目标运行日志在该日志感情色彩上的维度评估分值,且该日志感情色彩中还考虑了词性为副词的词语,如此,进一步确定了该目标运行日志所包括的有用信息,即进一步间接地提高了关键运行日志的实用性。
结合第一方面的第三种可能的实现方式,在第一方面的第七种可能的实现方式中,所述确定所述目标运行日志在所述多个指定维度上的维度评估分值,包括:
当所述多个指定维度中包括所述日志动作色彩时,对所述目标运行日志进行分词处理,得到多个词语;确定第三数量,所述第三数量为所述多个词语中词性为动词的词语的数量;确定第四数量,所述第四数量为所述多个词语中词性为动词进行时的词语的数量;确定第五数量,所述第五数量为所述多个词语中词性为动词过去时的词语的数量;将所述第三数量与第四预设分值的乘积、所述第四数量与第五预设分值的乘积和所述第五数量与第六预设分值的乘积之和确定为所述目标运行日志在所述日志动作色彩上的维度评估分值,所述第四预设分值为动词对应的分值,所述第五预设分值为动词进行时对应的分值,所述第六预设分值为动词过去时对应的分值。
在本发明实施例中,上述通过确定该目标运行日志在该日志动词色彩上的维度评估分值,同样可以确定该目标运行日志所包括的有用信息,即间接地提高了关键运行日志的实用性。
结合第一方面的第三种可能的实现方式,在第一方面的第八种可能的实现方式中,所述确定所述目标运行日志在所述多个指定维度上的维度评估分值,包括:
当所述多个指定维度中包括所述前后日志组件变化量时,确定所述目标运行日志包括的组件标识和指定运行日志包括的组件标识,所述指定运行日志为所述多个目标运行日志中在所述目标运行日志之前生成且生成时间距离所述目标运行日志的生成时间最近的运行日志;确定所述目标运行日志包括的组件标识中与所述指定运行日志包括的组件标识中不相同的标识的数量;将所确定的数量与所述前后日志组件变化量对应的第七预设分值的乘积确定为所述目标运行日志在所述前后日志组件变化量上的维度评估分值。
其中,上述组件标识所对应的组件主要用于辅助或支持***的运行。若该目标运行日志中的组件标识相对于指定目标运行日志中的组件标识变化较少,说明该目标运行日志与该指定目标运行日志可能属于同一个操作步骤,因此,在本发明实施例中,可以确定该目标运行日志包括的组件标识中与该指定运行日志包括的组件标识中不相同的标识的数量后,将确定的数量与该第七预设分值之和确定为该目标运行日志在该前后日志组件变化量上的维度评估分值。
在本发明实施例中,上述确定该目标运行日志在该前后日志组件变化量上的维度评估分值,可以确定该目标运行日志所覆盖的组件范围,即间接地确定了关键运行日志覆盖的组件范围。
结合第一方面的第三种可能的实现方式,在第一方面的第九种可能的实现方式中,所述确定所述目标运行日志在所述多个指定维度上的维度评估分值,包括:
当所述多个指定维度中包括所述前后日志时间差时,确定所述目标运行日志与指定运行日志之间的时间差,所述指定运行日志为所述多个目标运行日志中在所述目标运行日志之前生成且生成时间距离所述目标运行日志的生成时间最近的运行日志;将所述时间差确定为所述目标运行日志在所述前后日志时间差上的维度评估分值。
通常前后运行日志之间的时间差均在毫秒级别,且在生成每条运行日志时,均会对应有该运行日志的生成时间,因此,可以直接获取该目标运行日志的日志生成时间,以及该目标运行日志之前的指定运行日志的日志生成时间,以确定该目标运行日志与该指定运行日志之间的时间差。
在本发明实施例中,上述通过确定该目标运行日志在该前后日志时间差上的维度评估分值,可以确定该目标运行日志所覆盖的时间范围,即间接地确定了关键运行日志覆盖的时间范围。
结合第一方面至第一方面的第九种可能的实现方式,在第一方面的第十种可能的实现方式中,所述基于所述多条目标运行日志的评估总分值,从所述多条目标运行日志中确定所述目标操作流程对应的关键运行日志,包括:
基于所述多条目标运行日志的评估总分值,按照评估总分值从大到小的顺序,对所述多条目标运行日志进行排序;从排序后的多条目标运行日志中选择前N条目标运行日志,所述N大于或等于1;将所述前N条目标运行日志确定为所述目标操作流程对应的关键运行日志。
由于该各个评估总分值用于评估各条目标运行日志能够指示一个操作步骤的能力,该评估总分值越大,说明该评估总分值对应的目标运行日志能够指示一个操作步骤的能力越强,因此,首先按照评估总分值从大到小的顺序,对该多条目标运行日志进行排序,之后,从排序后的多条目标运行日志中获取前N条目标运行日志作为目标操作流程对应的关键运行日志,即获取的该前N条目标运行日志可以用于指示该目标操作流程中包括的多个操作步骤,如此,实现了对关键运行日志的提取操作。
在本发明实施例中,上述按照评估总分值从大到小的顺序对该多条目标运行日志进行排序,由于评估总分值越大,该评估总分值对应的目标运行日志指示一个操作步骤的能力越强,因此,在排序后的多条目标运行日志中,可以获取前N条目标运行日志,并将获取的前N条目标运行日志确定为该目标操作流程对应的关键运行日志,从而实现了关键运行日志的提取操作。
第二方面,提供了一种关键运行日志提取装置,所述关键运行日志提取装置具有实现上述第一方面中关键运行日志提取方法行为的功能。该关键运行日志提取装置包括至少一个模块,该至少一个模块用于实现上述第一方面所提供的关键运行日志提取方法。
第三方面,提供了一种关键运行日志提取装置,所述关键运行日志提取装置的结构中包括处理器和存储器,所述存储器用于存储支持关键运行日志提取装置执行上述关键运行日志提取方法的程序,以及存储用于实现该关键运行日志提取方法所涉及的数据,该数据包括***运行日志等。所述处理器被配置为用于执行所述存储器中存储的程序。所述关键运行日志提取装置还可以包括通信总线,该通信总线用于该处理器与存储器之间建立连接。
第四方面,本发明实施例提供了一种计算机存储介质,用于储存为上述关键运行日志提取装置所用的计算机软件指令,或存储用于执行上述第二方面和第三方面为关键运行日志提取装置所设计的程序。
上述本发明实施例第二到第四方面所获得的技术效果与第一方面中对应的技术手段获得的技术效果近似,在这里不再赘述。
本发明实施例提供的技术方案带来的有益效果是:在本发明实施例中,基于目标操作流程标识,从执行多个操作流程后生成的***运行日志中,获取多次执行目标操作流程后重复出现的多条目标运行日志,之后,基于多个指定维度和该多个指定维度的权重,确定该多条目标运行日志的评估总分值,其中,由于各个评估总分值评估了各条目标运行日志能够指示一个操作步骤的能力,因此,基于该多条目标运行日志的评估总分值,可以从该多条目标运行日志中确定该目标操作流程对应的关键运行日志,即所确定的关键运行日志能够更加准确地反应该目标操作流程中的各个操作步骤,解决了用户无法准确定位***故障的问题,提高了运维分析效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种终端的结构示意图;
图2A是根据一示例性实施例示出的一种关键运行日志提取方法的流程图;
图2B(1)是图2A实施例所涉及的一种预设词库的示意图;
图2B(2)是图2A实施例所涉及的另一种预设词库的示意图;
图3A是根据一示例性实施例示出的一种关键运行日志提取装置的结构示意图;
图3B是根据一示例性实施例示出的一种获取模块310的结构示意图;
图3C是根据一示例性实施例示出的一种第一确定模块320的结构示意图;
图3D根据一示例性实施例示出的一种第二确定模块330的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在本发明实施例中,可以通过诸如计算机等之类的终端来执行该关键运行日志提取方法。请参考图1,该图1是根据一示例性实施例示出的一种终端的结构示意图,该终端主要包括有一个或者一个以上处理核心的处理器110、包括有一个或一个以上计算机可读存储介质的存储器120以及通信总线130等。本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,本发明实施例对此不做限定。
其中,该处理器110是该终端的控制中心,该处理器110可以一个通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integratedcircuit,ASIC),或一个或多个用于控制本发明方案程序执行的集成电路。其中,该处理器110可以通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,来实现下文图2A实施例所提供的关键运行日志提取方法。
其中,该存储器120可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其它类型的静态存储设备,随机存取存储器(random accessmemory,RAM))或者可存储信息和指令的其它类型的动态存储设备,也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由集成电路存取的任何其它介质,但不限于此。存储器120可以是独立存在,通过通信总线130与处理器110相连接。存储器120也可以和处理器110集成在一起。
另外,上述通信总线130可包括一通路,在上述处理器110和存储器120之间传送信息。
图2A是根据一示例性实施例示出的一种关键运行日志提取方法的流程图,本实施例以该关键运行日志提取方法应用于终端中进行举例说明,该关键运行日志提取方法可以包括如下几个步骤:
步骤201:终端基于目标操作流程标识,从***运行日志中,获取多条目标运行日志。
在终端***中,通常包括多个功能模块,每个功能模块包括多个操作流程,通过执行该多个操作流程中,可以实现各个功能模块对应的各种功能。目前,为了便于后续对***进行运维分析,在***运行过程中,通常会生成***运行日志,该***运行日志为执行多个操作流程后生成得到,并且,通常情况下,请参考图1,该***运行日志可以存储在该终端的存储器120中。
在该***运行日志中,每个操作流程均对应有自己的操作流程标识,其中,该目标操纵流程可以用于唯一标识一个目标操作流程。因此,基于该目标操作流程标识,请参考图1,该终端的处理器110可以从存储器120存储的***运行日志中获取该目标操作流程对应的多条运行日志。
其中,在该多条运行日志中,包括了该目标操作流程对应的关键运行日志,该关键运行日志是指能够反应该目标操作流程中的多个操作步骤的运行日志,在本发明实施例中,为了确定该目标操作流程对应的关键运行日志,处理器110基于该多条运行日志中具有共性的运行日志来提取该关键运行日志,也即是,该处理器110从该多条运行日志中获取多条目标运行日志,该多条目标运行日志为多次执行目标操作流程后重复出现的运行日志,也即是,具有共性的运行日志。
不难理解,在实际运行过程中,每个操作流程均可能被执行多次,该处理器110获取该多次执行目标操作流程后重复出现的运行日志,其中,基于目标操作流程标识,从存储器120存储的***运行日志中,获取多条目标运行日志的具体实现方式包括:从该***运行日志中,获取该目标操作流程标识对应的多条运行日志,将该多条运行日志中每条运行日志包括的多个指定格式的日志信息替换成多个预设字符,该多个指定格式与该多个预设字符一一对应,从替换后的多条运行日志中,选择在多次执行该目标操作流程后重复出现的多条运行日志,将选择的多条运行日志确定为该多条目标运行日志。
其中,该多个指定格式可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不作限定。
其中,该多个预设字符可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不作限定。
其中,该多个指定格式的日志信息可以包括日志生成时间和日志编号等。在获取的多条运行日志中,当该多条运行日志中包括多个指定格式的日志信息时,容易影响判断是否是重复出现的日志。例如,当该日志信息包括日志生成时间和日志编号时,若第一次执行该目标操作流程生成运行日志A,该运行日志A的日志生成时间为12:00,第二次执行该目标操作流程生成运行日志B,该运行日志B的日志生成时间为12:02,但在该运行日志A和运行日志B中,除了该日志生成时间和日志编号不同,其它日志内容均相同,也就是说,该运行日志B实际上是重复出现的运行日志,但是,若不对该日志信息进行统一替换,则容易将该两条运行日志判定为不是重复出现的运行日志,从而影响判断结果。
因此,在提取关键运行日志之前,处理器110需要将该目标操作流程对应的多条运行日志中的多个指定格式的日志信息进行替换处理,即将该多个指定格式的日志信息替换成多个预设字符,例如,将该多条运行日志中的日志生成时间均替换成TIME(时间),将该多条运行日志中的日志编号均统一替换成ID(Identification,身份标识),用VALUE(值)代替其它指定格式的日志信息。之后,处理器110即可从替换后的多条运行日志中,选择在多次执行该目标操作流程后重复出现的多条运行日志,所选择的多条运行日志即为上述多条目标运行日志。
步骤202:终端基于多个指定维度和该多个指定维度的权重,确定该多条目标运行日志的评估总分值。
其中,该各个评估总分值用于评估各条目标运行日志能够指示一个操作步骤的能力,该评估总分值越大,说明该评估总分值对应的目标运行日志能够指示一个操作步骤的能力越强。
其中,该多个指定维度的权重可以由用户根据实际需求自定义设置,在本发明实施例中,该多个指定维度包括日志相似度、日志感情色彩、日志动作色彩、前后日志时间差以及前后日志组件变化量中的至少一种。
其中,该日志相似度可以用于指示该目标运行日志与该多条目标运行日志中的每条目标运行日志之间的相似度。该日志感情色彩可以用于指示该目标运行日志中所包含的形容词以及副词对应的感情色彩。该日志动作色彩可以用于指示该目标运行日志中包含的动词、动词过去时和动词进行时对应的感情色彩。该前后日志时间差是指该目标运行日志与前一条目标运行日志之间的时间差。该前后日志组件变化量可以用于指示该目标运行日志与前一条目标运行日志之间组件标识的变化情况。
其中,基于多个指定维度和该多个指定维度的权重,确定该多条目标运行日志的评估总分值的具体实现过程包括:对于该多条目标运行日志中的每条目标运行日志,确定该目标运行日志在该多个指定维度上的维度评估分值,确定该目标运行日志的多个维度评估分值与该多个指定维度中对应指定维度的权重之间的乘积,将该目标运行日志的多个维度评估分值与该多个指定维度中对应指定维度的权重之间的乘积之和确定为该目标运行日志的评估总分值。
上述指定维度的权重可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
其中,根据该多个指定维度不同,确定该目标运行日志在该多个指定维度上的维度评估分值的实现方式不同,具体可以包括如下实现方式:
第一种方式:当该多个指定维度中包括该日志相似度时,确定该多条目标运行日志中每条目标运行日志与该目标运行日志之间的相似度,确定该多条目标运行日志中与该目标运行日志之间相似度大于或等于预设阈值的目标运行日志的数量,将所确定的数量与该日志相似度对应的第一预设分值之间的乘积确定为该目标运行日志在日志相似度上的维度评估分值。
其中,该预设阈值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
其中,该第一预设分值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
其中,确定该多条目标运行日志中每条目标运行日志与该目标运行日志之间的相似度的实现方式,可以采用基于距离的相似度算法,具体实现过程可以参见相关技术,本发明实施例对此不做限定。
在实际实现过程中,处理器110可以给该目标运行日志的初始相似度赋予一个初始值,例如,处理器110可以将该目标运行日志的初始相似度赋值为“1”。之后,处理器110确定该目标运行日志与该多条目标运行日志中的每条目标运行日志之间的相似度,当该多条目标运行日志中的某条目标运行日志与该目标运行日志之间相似度大于或等于预设阈值时,说明该某条目标运行日志与该目标运行日志可能属于同一个操作步骤,因此,该处理器110确定该多条目标运行日志中与该目标运行日志属于同一操作步骤的运行日志的数量,即可得到该目标运行日志在该日志相似度上的维度评估分值。
例如,若该多条目标运行日志中包括10条与该目标运行日志之间的相似度大于或等于该预设阈值的目标运行日志,且上述第一预设分值为0.1,则可以得到该目标运行日志在该日志相似度上是维度评估分值为1+0.1*10,即为2。其中,“+”代表相加,“*”代表相乘。
上述通过确定该目标运行日志在该日志相似度上的维度评估分值,确定了该目标运行日志所覆盖的范围,即间接地确定了关键运行日志的覆盖范围。
第二种方式:当该多个指定维度中包括该日志感情色彩时,对该目标运行日志进行分词处理,得到多个词语,从该多个词语中选择词性为形容词的词语,确定第一数量,该第一数量为选择的词语的数量,基于该第一数量与第二预设分值,确定该目标运行日志在该日志感情色彩上的维度评估分值,该第二预设分值为形容词对应的分值。
其中,该第二预设分值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
其中,上述从该多个词语中选择词性为形容词的词语的具体实现过程可以包括:在该终端的存储器120中预先存储有词性为形容词的多个预设词语,终端的处理器110将该目标运行日志进行分词处理得到该多个词语后,对于该多个词语中的每个词语,该处理器110判断该词语是否属于该多个预设词语,当该词语属于该多个预设词语时,选择该词语,当该词语不属于该多个预设词语时,则不选择该词语。
例如,请参考图2B(1),假设该多个预设词语包括good,nice等,若上述词语为good,则可以确定该词语的词性为形容词,因此,处理器110选择该词语。反之,若该词语为phone,由于phone不属于该多个预设词语,因此,可以确定该词语的词性不是形容词,处理器110不选择该词语。
这里需要说明的是,在本发明实施例中,仅是以通过上述方式从该多个词语中选择词性为形容词的词语为例进行说明,在另一实施例中,还可以通过其它方式从该多个词语中选择词性为形容词的词语,本发明实施例对此不作限定。
按照上述实现方式,处理器110从该多个词语中,选择所有词性为形容词的词语,并确定所选择的词语的数量。在本发明实施例中,请继续参考图2B(1),在该终端的存储器120中预先存储形容词对应的第二预设分值,处理器110确定所选择的词语的数量后,将该数量与该第二预设分值相乘,即可得到该目标运行日志在该日志感情色彩上的维度评估分值。
另外,需要说明的是,在实际实现过程中,由于在该形容词之前还可能包括副词,当该形容词之前还包括有副词时,实际上又进一步加强了感情色彩的修饰,因此,在本发明实施例中,确定第一数量之后还包括如下实现过程。
确定第二数量,该第二数量为该选择的词语中存在与副词相邻的词语的数量,在该种情况下,上述基于该第一数量与第二预设分值,确定该目标运行日志在该日志感情色彩上的维度评估分值包括:确定该第一数量与该第二数量之间的差值,将该差值与该第二预设分值相乘,得到第一数值,将该第二数量、该第二预设分值和第三预设分值相乘,得到第二数值,该第三预设分值为副词对应的分值,将该第一数值和该第二数值之和确定为该目标运行日志在该日志感情色彩上的维度评估分值。
其中,该第三预设分值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
也即是,在该种实现方式中,针对上述确定的多个词性为形容词的词语中的每个词语,处理器110判断与该词语相邻的词语的词性是否为副词,如果与该词语相邻的词语的词性为副词,还需要在形容词对应的第二预设分值乘上副词对应的第三预设分值,得到组合分值。
例如,请参考图2B(2),若形容词词语“good”之前的词语为“very”,则可以确定该“very”的词性为副词,且可以获取到该第三预设分值为0.9,因此,可以得到“good”和“very”的组合分值为0.8*0.9,即为0.72。
在实际实现过程中,若上述第一数量为M,该第二数量为N,说明该第一数量中有N个词性为形容词的词语的相邻词语为副词,并且,该M与N之间的差值即为该多个词语中词性为形容词,且相邻的词语不是副词的词语个数。确定该M和N后,该处理器110将该M与N之间的差值与形容词对应的第二预设分值相乘,得到上述第一数值,该N、第二预设分值、和第三预设分值相乘,得到上述第二数值,该第一数值和该第二数值之和实际上即为该目标运行日志在该日志感情色彩上的维度评估分值。
例如,在上述例子中,该第二预设分值为0.8,该第三预设分值为0.9,因此可以确定该第一数值为(M-N)*0.8,该第二数值为N*0.8*0.9,因此,可以确定该目标运行日志在该日志感情色彩上的维度评估分值为(M-N)*0.8+N*0.8*0.9。其中,“-”代表相减。
其中,上述判断与该词语相邻的词语的词性是否为副词的实现过程与上述确定词语的词性是否为形容词的实现过程类似,这里不再详细描述。
上述通过确定该目标运行日志在该日志感情色彩上的维度评估分值,确定了该目标运行日志所包括的有用信息,即间接地提高了关键运行日志的实用性。
需要说明的是,上述确定该目标运行日志在该日志感情色彩上的维度评估分值的实现过程仅是示例性的,在另一实施例中,还可以通过其它方式来确定,例如,在一种可能的实现方式中,当词性为形容词的词语的相邻词语的词性不为副词时,处理器110可以默认确定形容词对应的第二预设分值与“1”相乘,并通过如下公式(1),确定该目标运行日志在该日志感情色彩上的维度评估分值,该公式(1)为:
其中,该Y代表该目标运行日志在该日志感情色彩上的维度评估分值,该M代表上述第一数量,该pi代表形容词对应的第二预设分值,该ci代表副词对应的第三预设分值。也就是说,在上述实现过程中,当词性为形容词的词语的相邻词语的词性不为副词时,默认该ci的值为“1”。
第三种方式:当该多个指定维度中包括该日志动作色彩时,对该目标运行日志进行分词处理,得到多个词语,确定第三数量,该第三数量为该多个词语中词性为动词的词语的数量,确定第四数量,该第四数量为该多个词语中词性为动词进行时的词语的数量,确定第五数量,该第五数量为该多个词语中词性为动词过去时的词语的数量,将该第三数量与第四预设分值的乘积、该第四数量与第五预设分值的乘积和该第五数量与第六预设分值的乘积之和确定为该目标运行日志在该日志动作色彩上的维度评估分值,该第四预设分值为动词对应的分值,该第五预设分值为动词进行时对应的分值,该第六预设分值为动词过去时对应的分值。
其中,该第四预设分值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
其中,该第五预设分值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
其中,该第六预设分值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
在该种实现方式中,确定该多个词语中词性为动词的词语的数量,确定该多个词语中词性为动词进行时的词语的数量,以及确定该多个词语中词性为动词过去时的词语的数量,之后,基于所确定的数量以及各个词性对应的预设分值,即可以确定该目标运行日志在动作感情色彩上的维度评估分值。
例如,若该动词对应的第四预设分值为1,动词进行时对应的第五预设分值为0.5,以及该动词过去时对应的第六预设分值为0.5,当该第三数量为2,该第四数量为1,该第五数量为0,则该目标运行日志在动作感情色彩上的维度评估分值为2*1+0.5*1+0*0.5,即为2.5。
上述确定词语的词性是否为动词、动词进行时或者动词过去时的实现过程与上述确定词语的词性是否为形容词的实现过程类似,这里不再详细描述。
上述通过确定该目标运行日志在该日志动词色彩上的维度评估分值,同样可以确定该目标运行日志所包括的有用信息,即间接地提高了关键运行日志的实用性。
第四种方式:当该多个指定维度中包括该前后日志组件变化量时,确定该目标运行日志包括的组件标识和指定运行日志包括的组件标识,该指定运行日志为该多个目标运行日志中在该目标运行日志之前生成且生成时间距离该目标运行日志的生成时间最近的运行日志,确定该目标运行日志包括的组件标识中与该指定运行日志包括的组件标识中不相同的标识的数量,将所确定的数量与该前后日志组件变化量对应的第七预设分值的乘积确定为该目标运行日志在该前后日志组件变化量上的维度评估分值。
其中,该第七预设分值可以由用户根据实际需求自定义设置,也可以由该终端默认设置,本发明实施例对此不做限定。
其中,上述组件标识可以用于唯一标识一个组件,组件通常可以用于辅助或支持终端***的运行。
在实际实现过程中,若该目标运行日志中的组件标识相对于指定目标运行日志中的组件标识变化较少,说明该目标运行日志与该指定目标运行日志可能属于同一个操作步骤,因此,在本发明实施例中,处理器110可以确定该目标运行日志包括的组件标识中与该指定运行日志包括的组件标识中不相同的标识的数量后,将确定的数量与该第七预设分值之和确定为该目标运行日志在该前后日志组件变化量上的维度评估分值。
上述确定该目标运行日志在该前后日志组件变化量上的维度评估分值,可以确定该目标运行日志所覆盖的组件范围,即间接地确定了关键运行日志覆盖的组件范围。
第五种方式:当该多个指定维度中包括该前后日志时间差时,确定该目标运行日志与指定运行日志之间的时间差,该指定运行日志为该多个目标运行日志中在该目标运行日志之前生成且生成时间距离该目标运行日志的生成时间最近的运行日志,将该时间差确定为该目标运行日志在该前后日志时间差上的维度评估分值。
通常前后运行日志之间的时间差均在毫秒级别,且在生成每条运行日志时,均会对应有该运行日志的生成时间,因此,处理器110可以直接获取该目标运行日志的日志生成时间,以及该目标运行日志之前的指定运行日志的日志生成时间,以确定该目标运行日志与该指定运行日志之间的时间差。
上述通过确定该目标运行日志在该前后日志时间差上的维度评估分值,可以确定该目标运行日志所覆盖的时间范围,即间接地提高了关键运行日志覆盖的时间范围。
上述确定了该目标运行日志在该多个指定维度上的维度评估分值后,处理器110将各个维度评估分值与对应的权重相乘,其中,如上文所述,该每个指定维度对应的权重可以由用户根据实际需求自定义设置,在本发明实施例中,由于日志相似度和前后日志组件变化量衡量一条目标运行日志所占的比重相对比较大一些,因此,可以将日志相似度和前后日志组件变化量对应的权重设置的比较大一些,其它维度对应的权重设置地比较小一些。在确定的多个乘积之后,将该多个乘积相加,即得到该目标运行日志的评估总分值。
需要说明的是,在本发明实施例中,仅是以该多个指定维度包括日志相似度、日志感情色彩、日志动作色彩、前后日志时间差以及前后日志组件变化量中的至少一种为例进行说明,在另一实施例中,该多个指定维度还可以包括其它维度,本发明实施例对此不做限定。
步骤203:终端基于该多条目标运行日志的评估总分值,从该多条目标运行日志中确定该目标操作流程对应的关键运行日志。
具体地,基于该多条目标运行日志的评估总分值,按照评估总分值从大到小的顺序,对该多条目标运行日志进行排序,从排序后的多条目标运行日志中选择前N条目标运行日志,该N大于或等于1,将该前N条目标运行日志确定为该目标操作流程对应的关键运行日志。
如前文所述,由于该各个评估总分值用于评估各条目标运行日志能够指示一个操作步骤的能力,该评估总分值越大,说明该评估总分值对应的目标运行日志能够指示一个操作步骤的能力越强,因此,处理器110首先按照评估总分值从大到小的顺序,对该多条目标运行日志进行排序,之后,从排序后的多条目标运行日志中获取前N条目标运行日志作为目标操作流程对应的关键运行日志,即获取的该前N条目标运行日志可以用于指示该目标操作流程中包括的多个操作步骤,如此,实现了对关键运行日志的提取操作。
在本发明实施例中,基于目标操作流程标识,从执行多个操作流程后生成的***运行日志中,获取多次执行目标操作流程后重复出现的多条目标运行日志,之后,基于多个指定维度和该多个指定维度的权重,确定该多条目标运行日志的评估总分值,其中,由于各个评估总分值评估了各条目标运行日志能够指示一个操作步骤的能力,因此,基于该多条目标运行日志的评估总分值,可以从该多条目标运行日志中确定该目标操作流程对应的关键运行日志,即所确定的关键运行日志能够更加准确地反应该目标操作流程中的各个操作步骤,解决了用户无法准确定位***故障的问题,提高了运维分析效果。
图3A是根据一示例性实施例示出的一种关键运行日志提取装置的结构示意图,该关键运行日志提取装置可以由软件、硬件或者两者的结合实现成为终端的部分或者全部,该终端可以为图1所示的终端。该关键运行日志提取装置可以包括:获取模块310、第一确定模块320和第二确定模块330,该获取模块310用于执行图2A实施例中的步骤201,该第一确定模块320用于执行图2A实施例中的步骤202,以及该第二确定模块330用于执行图2A实施例中的步骤203。
可选地,请参考图3B至图3D,该获取模块310包括:
获取单元310a,用于从该***运行日志中,获取该目标操作流程标识对应的多条运行日志;
替换单元310b,用于将该多条运行日志中每条运行日志包括的多个指定格式的日志信息替换成多个预设字符,该多个指定格式与该多个预设字符一一对应;
第一选择单元310c,用于从替换后的多条运行日志中,选择在多次执行该目标操作流程后重复出现的多条运行日志;
第一确定单元310d,用于将选择的多条运行日志确定为该多条目标运行日志。
可选地,该第一确定模块320包括:
第二确定单元320a,用于对于该多条目标运行日志中的每条目标运行日志,确定该目标运行日志在该多个指定维度上的维度评估分值;
第三确定单元320b,用于确定该目标运行日志的多个维度评估分值与该多个指定维度中对应指定维度的权重之间的乘积;
第四确定单元320c,用于将该目标运行日志的多个维度评估分值与该多个指定维度中对应指定维度的权重之间的乘积之和确定为该目标运行日志的评估总分值。
可选地,该第二确定单元320a,还用于执行图2A实施例中步骤202所涉及的第一种方式、第二种方式、第三种方式、第四种方式以及第五种方式。
可选地,该第二确定模块330包括:
排序单元330a,用于基于该多条目标运行日志的评估总分值,按照评估总分值从大到小的顺序,对该多条目标运行日志进行排序;
第二选择单元330b,用于从排序后的多条目标运行日志中选择前N条目标运行日志,所述N大于或等于1;
第五确定单元330c,用于将该前N条目标运行日志确定为该目标操作流程对应的关键运行日志。
在本发明实施例中,基于目标操作流程标识,从执行多个操作流程后生成的***运行日志中,获取多次执行目标操作流程后重复出现的多条目标运行日志,之后,基于多个指定维度和该多个指定维度的权重,确定该多条目标运行日志的评估总分值,其中,由于各个评估总分值评估了各条目标运行日志能够指示一个操作步骤的能力,因此,基于该多条目标运行日志的评估总分值,可以从该多条目标运行日志中确定该目标操作流程对应的关键运行日志,即所确定的关键运行日志能够更加准确地反应该目标操作流程中的各个操作步骤,解决了用户无法准确定位***故障的问题,提高了运维分析效果。
需要说明的是:上述实施例提供的关键运行日志提取装置在实现关键运行日志提取方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的关键运行日志提取装置与关键运行日志提取方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。