CN108121716A - 处理问题单的方法和问题单处理*** - Google Patents
处理问题单的方法和问题单处理*** Download PDFInfo
- Publication number
- CN108121716A CN108121716A CN201611071663.8A CN201611071663A CN108121716A CN 108121716 A CN108121716 A CN 108121716A CN 201611071663 A CN201611071663 A CN 201611071663A CN 108121716 A CN108121716 A CN 108121716A
- Authority
- CN
- China
- Prior art keywords
- keyword
- network failure
- text message
- words
- weighted value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一种处理问题单的方法和问题单处理***,涉及通信技术领域,用以解决现有技术中难以实现有针对性进行数据采集的问题。该方法包括:问题单处理***在接收到第一问题单后,确定目标关键词集合,然后根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与目标关键词集合相似度最高的关键词集合,最后输出第二问题单。这种技术方案由于能够输出第二问题单,使得运维人员在查看时不仅能够看到问题单上描述网络故障的文本信息,还能查看到采集策略,从而使得运维人员能够基于第二问题单上的采集策略有针对性的采集用于诊断网络故障的数据,降低了运维人员采集用于诊断网络故障的数据时的工作量,从而提高了诊断网络故障的效率。
Description
技术领域
本申请涉及通信技术领域,特别涉及一种处理问题单的方法和问题单处理***。
背景技术
目前,客户(如运营商)在发现网络故障后,向设备厂商的问题单处理***提交问题单,其中,该问题单中记载了描述网络故障的文本信息。如图1所示,问题单处理***接到该问题单后,确定该问题单为还未处理的问题单,将该问题单发送到问题单派发***,并通过问题单派发***分发到一线运维人员的终端上,然后基于问题单上记载的描述网络故障的文本信息,前往客户现场解决问题。对于一线运维人员无法解决的复杂故障,通常的做法是一线运维人员基于二线运维专家的指示采集用于诊断网络故障的相关数据,然后再将采集到的数据回传给二线运维专家进行离线的故障诊断,然后确定发生故障的网络设备。
通常情况下,二线运维专家由于未到网络故障的现场,为快速发现网络故障的原因找到发生故障的网络设备,会指示一线运维人员作全量式采集,这会消耗大量时间在采集阶段及回传数据时的传输阶段。由于运维人员在不知道故障原因的情况下,难以有针对性的获取用于诊断网络故障的数据,大大增加了在采集用于诊断网络故障的数据时的工作量。
发明内容
本申请提供了一种处理问题单的方法和问题单处理***,用以解决现有技术中存在运维人员不知道故障原因的情况下,难以实现有针对性的数据采集的问题。
第一方面,提供了一种处理问题单的方法,包括:
问题单处理***在接收到第一问题单后,确定目标关键词集合,然后根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与目标关键词集合相似度最高的关键词集合,最后输出第二问题单,第二问题单中包括用于描述网络故障的文本信息以及与查找到的关键词集合对应的采集策略,采集策略为获取用于诊断网络故障的数据的方法,第一问题单为需要处理的问题单,第一问题单中包括用于描述网络故障的文本信息,目标关键词集合中包括至少一个关键词,至少一个关键词为用于描述网络故障的文本信息的关键词。
由于问题单处理***能够在接收到第一问题单后,对第一问题单进行处理,得到包括采集策略的第二问题单,然后输出第二问题单,使得运维人员在查看时不仅能够看到问题单上描述网络故障的文本信息,还能查看到采集策略,使得运维人员能够基于第二问题单上的采集策略有针对性的采集用于诊断网络故障的数据,降低了运维人员采集用于诊断网络故障的数据时的工作量,从而提高了诊断网络故障的效率。
在第一方面的基础上,可选的,问题单处理***通过下列方式确定目标关键词集合:
问题单处理***确定用于描述网络故障的文本信息的至少一个关键词集合;然后分别确定至少一个关键词集合中每个关键词的权重值,权重值用于表征关键词在用于描述网络故障的文本信息中的重要程度;并分别确定至少一个关键词集合中每个关键词集合的权重值,关键词集合的权重值为关键词集合中每个关键词的权重值之和;最后确定目标关键词集合为关键词集合的权重值最大的关键词集合。
由于问题单处理***通过上述方式确定目标关键词集合,提高了确定的目标关键词集合中关键词的准确性。
在第一方面的基础上,可选的,问题单处理***针对每个关键词,若确定预先存储的关键词库中包括关键词,则按照下列方式确定关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值;
问题单处理***若确定关键词库中不包括关键词,则按照下列方式确定关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值×关键度权值;
问题单处理***针对每个关键词集合确定初始权重值最高的关键词,根据下列方式调整每个关键词集合中的关键词的初始权重值,得到关键词的权重值:
权重值=初始权重值×(1+距离权值/关键词与初始权重值最高的关键词之间的距离);
其中,关键词的词频为关键词在用于描述网络故障的文本信息中出现的次数;频繁度权值为与关键词的词频对应的系数;英文数字长度权值为与关键词中英文数字的长度对应的系数;距离权值为关键词与初始权重值最高的关键词之间的距离对应系数。
由于问题单处理***通过上述方式确定关键词的权重值,提高了确定出的权重值得准确性,更加准确的表征了关键词在第一问题单中用于描述网络故障的文本信息中的重要程度。
在第一方面的基础上,可选的,问题单处理***在确定目标关键词集合后,
将目标关键词集合中不包括在关键词库中的关键词存储到关键词库中;以及将目标关键词集合中不包括在关键词库中的关键词存储到对应关系表中。
在第一方面的基础上,可选的,问题单处理***根据下列方式预先存储关键词集合与采集策略的对应关系表:
问题单处理***根据第三问题单中用于描述网络故障的文本信息,确定对应关系表中的关键词集合;以及根据第三问题单中用于描述处理网络故障的文本信息,确定采集策略;第三问题单为已完成处理的问题单;并将关键词集合与采集策略的对应关系存储到对应关系表中。
需要说明的是,在本申请中,除了本申请提供的预先存储对应关系表的方式外,还可以人工配置好关键词集合与采集策略的对应关系表后,存储到问题单处理***中,或者其它存储空间中。
由于问题单处理***能够基于已完成处理的问题单预先存储关键词集合与采集策略的对应关系表,从而避免了人工配置关键词集合与采集策略的对应关系列表,提高了问题单处理***的智能性。
第二方面,提供了一种问题单处理***,包括接口单元和处理单元,其中,接口单元用于接收到第一问题单,第一问题单为需要处理的问题单,第一问题单中包括用于描述网络故障的文本信息;处理单元用于确定目标关键词集合,目标关键词集合中包括至少一个关键词,至少一个关键词为用于描述网络故障的文本信息的关键词;以及根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与目标关键词集合相似度最高的关键词集合;接口单元还用于输出第二问题单,第二问题单中包括用于描述网络故障的文本信息以及与查找到的关键词集合对应的采集策略。
在第二方面的基础上,可选的,处理单元确定用于描述网络故障的文本信息的至少一个关键词集合;并分别确定至少一个关键词集合中每个关键词的权重值,权重值用于表征关键词在用于描述网络故障的文本信息中的重要程度;以及分别确定至少一个关键词集合中每个关键词集合的权重值,关键词集合的权重值为关键词集合中每个关键词的权重值之和;再确定目标关键词集合为关键词集合的权重值最大的关键词集合。
在第二方面的基础上,可选的,处理单元根据下列方式确定至少一个关键词集合中每个关键词的权重值:
针对每个关键词,若确定预先存储的关键词库中包括关键词,则按照下列方式确定关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值;
若确定关键词库中不包括关键词,则按照下列方式确定关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值×关键度权值;
针对每个关键词集合确定初始权重值最高的关键词,根据下列方式调整每个关键词集合中的关键词的初始权重值,得到关键词的权重值:
权重值=初始权重值×(1+距离权值/关键词与初始权重值最高的关键词之间的距离);
其中,关键词的词频为关键词在用于描述网络故障的文本信息中出现的次数;频繁度权值为与关键词的词频对应的系数;英文数字长度权值为与关键词中英文数字的长度对应的系数;距离权值为关键词与初始权重值最高的关键词之间的距离对应系数。
在第二方面的基础上,可选的,处理单元在确定目标关键词集合后,将目标关键词集合中不包括在关键词库中的关键词存储到关键词库中;以及将目标关键词集合中不包括在关键词库中的关键词存储到对应关系表中。
在第二方面的基础上,可选的,处理单元根据下列方式预先存储关键词集合与采集策略的对应关系表:
根据第三问题单中用于描述网络故障的文本信息,确定对应关系表中的关键词集合;以及根据第三问题单中用于描述处理网络故障的文本信息,确定采集策略;第三问题单为已完成处理的问题单;并将关键词集合与网络故障信息采集策略的对应关系存储到对应关系表中。
第三方面,本申请提供一种处理问题单的装置,包括处理器和存储器,存储器用于存储程序,处理器调用存储器存储的程序,以执行本申请第一方面提供的任一方法。
第四方面,本申请提供一种处理问题单的装置,包括用于执行以上第一方面的任一方法的至少一个处理元件(或芯片)。
第五方面,本申请提供一种处理问题单的程序,该程序在被处理器执行时用于执行以上第一方面的任一方法。
第六方面,提供一种程序产品,例如计算机可读存储介质,包括第五方面的程序。
附图说明
图1为现有技术中问题单处理流程示意图;
图2为本申请实施例问题单处理流程示意图;
图3为本申请实施例问题单示意图;
图4为本申请实施例处理问题单的方法流程示意图;
图5为本申请实施例对关键词集合与采集策略的对应关系表的示意图;
图6为本申请实施例问题单处理***的结构示意图;
图7为本申请实施例问题单处理***的硬件结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。
如图2所示,本申请实施例中的处理问题单的方法的一种应用场景示意图,当客户如运营商在发现网络故障后,可告知设备商的客服人员描述发生网络故障后的现象,客服人员在问题单处理***中的问题单录入模块提供的问题单中记录描述网络故障的文本信息,其中,问题单可以如图3所示,问题单中包括编号、故障类型、故障设备类型、故障设备版本、故障现象、诊断过程、造成故障的原因。其中,客服人员可根据客户的描述填写问题单中的位置1、5,其中位置1可以由人工填写,也可以由问题单处理***自动生成,位置5需要基于用户的描述填写,其中位置5中填写的文本信息即为本申请中用于描述网络故障的文本信息,位置2、3、4、6、7需要由运维人员在处理完网络故障后填写。然后客服人员在填写完后的问题单即为本申请实施例中的第一问题单,客服提交将填写后的问题单提交到问题单处理***。
此外,还可由客户通过客户端直接向问题单处理***发送包括用于描述网络故障信息的问题单。
其中,通过在现有问题单处理***中增加问题单格式分析模块和问题单特征解析模块来实现向运维人员推送第一问题单中所描述的网络故障的采集策略,其中在实现时可通过一个或多个处理设备、元件或芯片实现问题单格式分析模块和问题单特征解析模块的功能。具体的,如图4所示,本申请实施例处理问题单的方法,包括:
步骤400,问题单处理***接收到第一问题单,其中第一问题单为需要处理的问题单,第一问题单中包括用于描述网络故障的文本信息。
具体的,问题单处理***中的问题单录入模块将第一问题单发送到问题单格式分析模块,问题单格式分析模块对问题单录入模块发送的第一问题单进行格式解析,获取第一问题单中用于描述网络故障的文本信息,并向问题单特征分析模块发送获取的第一问题单中用于描述网络故障的文本信息。
其中,问题单格式分析模块用于基于预设的算法区分问题单中用于描述网络故障的文本信息和用于描述诊断网络故障的文本信息。
步骤410,问题单处理***确定目标关键词集合,目标关键词集合中包括至少一个关键词,至少一个关键词为用于描述网络故障的文本信息的关键词。
由问题单特征解析模块对第一问题单中用于描述网络故障的文本信息进行解析,得到目标关键词集合,应理解,对一段文字提取的关键词可能有多种方式,可选的,问题单特征解析模块遍历用于描述网络故障的文本信息所有可能的关键词集合,然后分别确定每个关键词集合中每个关键词的权重值;以及分别确定至少一个关键词集合中每个关键词集合的权重值,其中,关键词集合的权重值为关键词集合中每个关键词的权重值之和;再确定目标关键词集合为关键词集合的权重值最大的关键词集合,其中在本申请实施例中权重值用于表征关键词在用于描述网络故障的文本信息中的重要程度。
较佳的,问题单特征解析模块按照下列方式确定权重值:
问题单特征解析模块首先对第一问题单中用于描述网络故障的文本信息进行清洗,去除无意义的标点符号及字(如“的”等),然后提取清洗后的用于描述网络故障的文本信息中的关键词,可选的,问题单特征解析模块可基于关键词库中存储的关键词提取清洗后的用于描述网络故障的文本信息中的关键词,并基于预设算法确定提取的每个关键词的权重值,较佳的,为了提高确定的权重值的准确性,问题单特征解析模块可基于下列方式确定权重值:
若确定预先存储的关键词库中包括提取的关键词,则按照下列方式确定提取的关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值;
问题单处理***若确定关键词库中不包括提取的关键词,则按照下列方式确定关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值×关键度权值;
问题单处理***针对每个关键词集合确定初始权重值最高的关键词,根据下列方式调整每个关键词集合中的关键词的初始权重值,得到关键词的权重值:
权重值=初始权重值×(1+距离权值/关键词与初始权重值最高的关键词之间的距离);
其中,关键词的词频为关键词在用于描述网络故障的文本信息中出现的次数;频繁度权值为与关键词的词频对应的系数;英文数字长度权值为与关键词中英文数字的长度对应的系数;距离权值为关键词与初始权重值最高的关键词之间的距离对应系数。
需要说明的是,可以预先存储频繁度权值与关键词的词频的对应关系,以及英文数字长度权值与英文数字长度的对应关系,其中,关键词中英文数据长度所占比例越大,英文数据长度权值的取值也就越大,用于描述网络故障的文本信息中某个关键词出现的次数越多,其对应的频繁度权值也就越大。在具体实施中,英文数字权值可以取一个相同的值。
在本申请实施例中,假设初始权重值最高的关键词为关键词2,关键词2与关键词2之间的距离为1,假设关键词1为与关键词2相邻的关键词,则关键词1与关键词2之间的距离为2,依次类推。
步骤420,问题单处理***根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与目标关键词集合相似度最高的关键词集合。
其中,关键词集合与采集策略的对应关系列表可以由人工进行配置,然后存储到问题单处理***中,此外,关键词集合与采集策略的对应关系列表还可以基于已完成处理的问题单提取关键词集合和采集策略,具体的,问题单处理***根据第三问题单中用于描述网络故障的文本信息,确定对应关系表中的关键词集合;以及根据第三问题单中用于描述处理网络故障的文本信息,确定采集策略;第三问题单为已完成处理的问题单;并将关键词集合与采集策略的对应关系存储到对应关系表中。其中,在本申请实施例中第三问题单存储在历史问题单数据库中。
应理解,在本申请实施例中,关键词集合与采集策略的对应关系列表可以如图5所示,但不仅仅限于图5所示的对应关系表的格式。其中问题单编号即为第三问题单中的问题单编号。具体的,问题单处理***确定第三问题单中关键词及关键词的权重值的方式与问题单处理***确定第一问题单中关键词及关键词的权重值得方式类似,在此不再赘述。
需要说明的是,在本申请实施例中,假设问题单处理***提取的已完成处理的问题单1中的用于描述网络故障的文本信息的关键词包括10个,而关键词9和关键词10的权重值若小于预设阈值,则为了避免对应关系表中关键词过多,则不再考虑权重值较小的关键词,则已完成处理的问题单1中的用于描述网络故障的文本信息的关键词集合中包括关键词1、关键词2、关键词3、关键词4、关键词5、关键词6、关键词7和关键词8,假设问题单处理***提取的已完成的问题单2的关键词集合中包括关键词1、关键词6、关键词9、关键词10、关键词11、关键词12、关键词13和关键词14,则将关键词10、关键词11、关键词12、关键词13和关键词14增加到对应关系表和关键词库中,并基于新增关键词库重新确定已完成处理的问题单1中的关键词,以及关键词的权重值,其中若对应关系表中包括的关键词12,而已完成处理的问题单1中不包括该关键词12,则将已完成处理的问题单1中关键词12对应的权重值置为0。
当问题单处理***确定第一问题单中的目标关键词集合中包括对应关系列表中不包括的关键词时,则更新关键词库和对应关系表,具体的问题单处理***将目标关键词集合中不包括在关键词库和对应关系表中的关键词存储到关键词库和对应关系表中,然后问题单处理***基于更新后的关键词库重新确定对应关系表中各个问题单编号对应的关键词的权重值。
由于在本申请实施例中问题单处理***在提取问题单中用于描述网络故障的文本信息的关键词时可能得到多个关键词,但有些关键词的权重值比较小,去除这些关键词不会影响对网络故障的描述,因为为了降低问题单处理***的计算量,通常情况下,问题单处理***确定的目标关键词集合中仅包括从所有关键词中选择权重值大于预设阈值的关键词。
此外,在本申请实施例中,采集策略包括:
(1)网络故障数据的采集对象,例如设备的IP(Internet Protocol,网络之间互连的协议)、端口号或者用户索引等;
(2)网络故障数据的采集命令或命令组;
(3)原已完成处理的问题单在诊断网络故障时采集的数据信息,如命令回显得原始数据、或者从命令回显中直接提取的状态或统计信息。
其中,问题单处理***具体预设规则提取网络故障数据的采集命令或命令组,其中,预设规则可以为起始符号为预设的特定符号,如“:”;或者字符在预设的采集命令字库中,或者字符串满足采集命令库的模板,如“display interface GigabitEthernet$inf_name”,其中$inf_name表示任意一个单词。需要说明的是,预设规则可以为上述三个规则中的一个或多个,满足其中一个则提取出来作为采集命令。
在本申请实施例中,问题单处理***可基于下列方式确定目标关键词集合与对应关系表中关键词集合的相似度:
以对应关系表中问题单编号为1的关键词集合为例,假设问题单编号为1的关键词集合包括n个关键词,关键词1到关键词n,则将目标关键词集合包括关键词2、关键词4、关键词6、关键词8和关键词9,则将目标关键词集合扩展为n个关键词,使得目标关键词集合中包括关键词1到关键词n,其中目标关键词集合中不包括的关键词的权重值置为0,然后由问题单编号为1的关键词集合中每个关键词的权重值组成一个n为向量,由扩展后的目标关键词集合组成一个n维向量,然后计算这两个向量的夹角,其中夹角越小,表示相似度越高。
当夹角最小对应关系列表中多个问题单编号的关键词集合时,则这些问题单编号对应的关键词集合均为目标关键词集合相似度最高的集合。
步骤430,问题单处理***输出第二问题单,第二问题单中包括用于描述网络故障的文本信息以及与查找到的关键词集合对应的采集策略,采集策略为获取用于诊断网络故障的数据的方法。
具体的,问题单特征解析模块将查找到的关键词集合对应的采集策略存储到第一问题单上得到第二问题单是,然后将第二问题单输出到问题单派发***,通过问题单派发***发送给运维人员。
当运维人员在处理完该第一问题单的网络故障时,若第一问题单中网络故障时按照采集策略的指示处理的,则删除该问题单,若不是采用采集策略处理的,则在该第一问题单上填写诊断过程,网络故障的根本原因等,然后将填写完整的问题单存储到历史问题单数据库中,当问题单处理***在检测到历史问题单数据库中增加了新的问题单后,更新对应关系表。
需要说明的是,在本申请实施例中第一问题单、第二问题单、第三问题单的格式可以不同,例如第一问题单中仅包括用于描述网络故障的文本信息,第二问题单中仅包括用于描述网络故障的文本信息和查找到的关键词集合对应的采集策略,第三问题单中包括用于描述网络故障的文本信息,以及用于诊断网络故障的文本信息。
基于同一发明构思,本申请实施例中还提供了一种问题单处理***,由于本申请实施例中的问题单处理***对应的方法为本申请实施例处理问题单的方法,因此本申请实施例问题单处理***的实施可以参见该方法的实施,重复之处不再赘述。
如图6所示,本申请实施例问题单处理***,包括接口单元610和处理单元620,其中,接口单元610用于接收到第一问题单,第一问题单为需要处理的问题单,第一问题单中包括用于描述网络故障的文本信息;处理单元620用于确定目标关键词集合,目标关键词集合中包括至少一个关键词,至少一个关键词为用于描述网络故障的文本信息的关键词;以及根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与目标关键词集合相似度最高的关键词集合;接口单元610还用于输出第二问题单,第二问题单中包括用于描述网络故障的文本信息以及与查找到的关键词集合对应的采集策略。
可选的,处理单元620确定用于描述网络故障的文本信息的至少一个关键词集合;并分别确定至少一个关键词集合中每个关键词的权重值,权重值用于表征关键词在用于描述网络故障的文本信息中的重要程度;以及分别确定至少一个关键词集合中每个关键词集合的权重值,关键词集合的权重值为关键词集合中每个关键词的权重值之和;再确定目标关键词集合为关键词集合的权重值最大的关键词集合。
可选的,处理单元620根据下列方式确定至少一个关键词集合中每个关键词的权重值:
针对每个关键词,若确定预先存储的关键词库中包括关键词,则按照下列方式确定关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值;
若确定关键词库中不包括关键词,则按照下列方式确定关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值×关键度权值;
针对每个关键词集合确定初始权重值最高的关键词,根据下列方式调整每个关键词集合中的关键词的初始权重值,得到关键词的权重值:
权重值=初始权重值×(1+距离权值/关键词与初始权重值最高的关键词之间的距离);
其中,关键词的词频为关键词在用于描述网络故障的文本信息中出现的次数;频繁度权值为与关键词的词频对应的系数;英文数字长度权值为与关键词中英文数字的长度对应的系数;距离权值为关键词与初始权重值最高的关键词之间的距离对应系数。
可选的,处理单元620在确定目标关键词集合后,将目标关键词集合中不包括在关键词库中的关键词存储到关键词库中;以及将目标关键词集合中不包括在关键词库中的关键词存储到对应关系表中。
可选的,处理单元620根据下列方式预先存储关键词集合与采集策略的对应关系表:
根据第三问题单中用于描述网络故障的文本信息,确定对应关系表中的关键词集合;以及根据第三问题单中用于描述处理网络故障的文本信息,确定采集策略;第三问题单为已完成处理的问题单;并将关键词集合与网络故障信息采集策略的对应关系存储到对应关系表中。
应理解,以上所描述的问题单处理***的实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本申请提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
应注意,在本申请中,接口单元610可以由输入输出接口实现,处理单元620由处理器实现。
如图7所示,问题单处理***700可以包括处理器710、输入输出接口720、存储器730。其中,存储器730可以用于问题单处理***700出厂时预装的程序/代码,也可以存储用于处理器710执行时的代码等。
其中,处理器710可以采用通用的CPU(Central Processing Unit,中央处理器),微处理器,ASIC(Application Specific Integrated Circuit,应用专用集成电路),或者一个或多个集成电路,用于执行相关操作,以实现本申请实施例所提供的技术方案。
尽管图7所示的问题单处理***700仅仅示出了处理器710、输入输出接口720和存储器730,但是在具体实现过程中,本领域的技术人员应当明白,该问题单处理***还包含实现正常运行所必须的其他器件。同时,根据具体需要,本领域的技术人员应当明白,该问题单处理***还可包含实现其他附加功能的硬件器件。此外,本领域的技术人员应当明白,该问题单处理***也可仅仅包含实现本申请实施例所必须的器件或模块,而不必包含图7中所示的全部器件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁盘、光盘、ROM(Read-Only Memory,只读存储记忆体)或RAM(Random Access Memory,随机存储记忆体)等。
从上述内容可以看出:问题单处理***在接收到第一问题单后,确定目标关键词集合,然后根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与目标关键词集合相似度最高的关键词集合,最后输出第二问题单,第二问题单中包括用于描述网络故障的文本信息以及与查找到的关键词集合对应的采集策略,采集策略为获取用于诊断网络故障的数据的方法,第一问题单为需要处理的问题单,第一问题单中包括用于描述网络故障的文本信息,目标关键词集合中包括至少一个关键词,至少一个关键词为用于描述网络故障的文本信息的关键词。这种技术方案由于问题单处理***能够在接收到第一问题单后,对第一问题单进行处理,得到包括采集策略的第二问题单,然后输出第二问题单,使得运维人员在查看时不仅能够看到问题单上描述网络故障的文本信息,还能查看到采集策略,使得运维人员能够基于第二问题单上的采集策略有针对性的采集用于诊断网络故障的数据,降低了运维人员采集用于诊断网络故障的数据时的工作量,从而提高了诊断网络故障的效率。
本领域内的技术人员应明白,本申请实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种处理问题单的方法,其特征在于,包括:
问题单处理***接收到第一问题单,所述第一问题单为需要处理的问题单,所述第一问题单中包括用于描述网络故障的文本信息;
所述问题单处理***确定目标关键词集合,所述目标关键词集合中包括至少一个关键词,所述至少一个关键词为所述用于描述网络故障的文本信息的关键词;
所述问题单处理***根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与所述目标关键词集合相似度最高的关键词集合,所述采集策略为获取用于诊断网络故障的数据的方法;
所述问题单处理***输出第二问题单,所述第二问题单中包括所述用于描述网络故障的文本信息以及与查找到的所述关键词集合对应的采集策略。
2.如权利要求1所述的方法,其特征在于,所述问题单处理***确定所述目标关键词集合,包括:
所述问题单处理***确定所述用于描述网络故障的文本信息的至少一个关键词集合;
所述问题单处理***分别确定所述至少一个关键词集合中每个关键词的权重值,所述权重值用于表征关键词在所述用于描述网络故障的文本信息中的重要程度;
所述问题单处理***分别确定所述至少一个关键词集合中每个关键词集合的权重值,所述关键词集合的权重值为所述关键词集合中每个关键词的权重值之和;
所述问题单处理***确定所述目标关键词集合为关键词集合的权重值最大的关键词集合。
3.如权利要求2所述的方法,其特征在于,所述问题单处理***确定所述至少一个关键词集合中每个关键词的权重值,包括:
所述问题单处理***针对所述每个关键词,若确定预先存储的关键词库中包括所述关键词,则按照下列方式确定所述关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值;
所述问题单处理***若确定所述关键词库中不包括所述关键词,则按照下列方式确定所述关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值×关键度权值;
所述问题单处理***针对每个关键词集合确定初始权重值最高的关键词,根据下列方式调整每个关键词集合中的关键词的初始权重值,得到关键词的权重值:
权重值=初始权重值×(1+距离权值/关键词与初始权重值最高的关键词之间的距离);
其中,所述关键词的词频为所述关键词在所述用于描述网络故障的文本信息中出现的次数;所述频繁度权值为与所述关键词的词频对应的系数;所述英文数字长度权值为与所述关键词中英文数字的长度对应的系数;所述距离权值为所述关键词与所述初始权重值最高的关键词之间的距离对应系数。
4.如权利要求3所述的方法,其特征在于,所述问题单处理***在确定所述目标关键词集合后,还包括:
所述问题单处理***将所述目标关键词集合中不包括在所述关键词库中的关键词存储到所述关键词库中;
所述问题单处理***将所述目标关键词集合中不包括在所述关键词库中的的关键词存储到所述对应关系表中。
5.如权利要求1至4任一所述的方法,其特征在于,所述问题单处理***根据下列方式预先存储关键词集合与采集策略的对应关系表:
所述问题单处理***根据第三问题单中用于描述网络故障的文本信息,确定所述对应关系表中的关键词集合;以及根据所述第三问题单中用于描述诊断网络故障的文本信息,确定采集策略;所述第三问题单为已完成处理的问题单;
所述问题单处理***将所述关键词集合与采集策略的对应关系存储到所述对应关系表中。
6.一种问题单处理***,其特征在于,包括:
接口单元,用于接收到第一问题单,所述第一问题单为需要处理的问题单,所述第一问题单中包括用于描述网络故障的文本信息;
处理单元,用于确定目标关键词集合,所述目标关键词集合中包括至少一个关键词,所述至少一个关键词为所述用于描述网络故障的文本信息的关键词;以及根据预设算法,从预先存储的关键词集合与采集策略的对应关系表中,查找与所述目标关键词集合相似度最高的关键词集合,所述采集策略为获取用于诊断网络故障的数据的方法;
所述接口单元,还用于输出第二问题单,所述第二问题单中包括所述用于描述网络故障的文本信息以及与查找到的所述关键词集合对应的采集策略。
7.如权利要求6所述的***,其特征在于,所述处理单元确定目标关键词集合,具体用于:
确定所述用于描述网络故障的文本信息的至少一个关键词集合;并分别确定所述至少一个关键词集合中每个关键词的权重值,所述权重值用于表征关键词在所述用于描述网络故障的文本信息中的重要程度;以及分别确定所述至少一个关键词集合中每个关键词集合的权重值,所述关键词集合的权重值为所述关键词集合中每个关键词的权重值之和;再确定所述目标关键词集合为关键词集合的权重值最大的关键词集合。
8.如权利要求7所述的***,其特征在于,所述处理单元确定所述至少一个关键词集合中每个关键词的权重值,具体用于:
针对所述每个关键词,若确定预先存储的关键词库中包括所述关键词,则按照下列方式确定所述关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值;
若确定所述关键词库中不包括所述关键词,则按照下列方式确定所述关键词的初始权重值:
初始权重值=关键词的词频×频繁度权值×关键词的长度×英文数字长度权值×关键度权值;
针对每个关键词集合确定初始权重值最高的关键词,根据下列方式调整每个关键词集合中的关键词的初始权重值,得到关键词的权重值:
权重值=初始权重值×(1+距离权值/关键词与初始权重值最高的关键词之间的距离);
其中,所述关键词的词频为所述关键词在所述用于描述网络故障的文本信息中出现的次数;所述频繁度权值为与所述关键词的词频对应的系数;所述英文数字长度权值为与所述关键词中英文数字的长度对应的系数;所述距离权值为所述关键词与所述初始权重值最高的关键词之间的距离对应系数。
9.如权利要求8所述的***,其特征在于,所述处理单元,还用于:
在确定所述目标关键词集合后,将所述目标关键词集合中不包括在所述关键词库中的的关键词存储到所述关键词库中;以及将所述目标关键词集合中不包括在所述关键词库中的关键词存储到所述对应关系表中。
10.如权利要求6至9任一所述的***,其特征在于,所述处理单元根据下列方式预先存储关键词集合与采集策略的对应关系表:
根据第三问题单中用于描述网络故障的文本信息,确定所述对应关系表中的关键词集合;以及根据所述第三问题单中用于描述处理网络故障的文本信息,确定采集策略;所述第三问题单为已完成处理的问题单;并将所述关键词集合与采集策略的对应关系存储到所述对应关系表中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611071663.8A CN108121716A (zh) | 2016-11-28 | 2016-11-28 | 处理问题单的方法和问题单处理*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611071663.8A CN108121716A (zh) | 2016-11-28 | 2016-11-28 | 处理问题单的方法和问题单处理*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108121716A true CN108121716A (zh) | 2018-06-05 |
Family
ID=62224222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611071663.8A Pending CN108121716A (zh) | 2016-11-28 | 2016-11-28 | 处理问题单的方法和问题单处理*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108121716A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376873A (zh) * | 2018-09-11 | 2019-02-22 | 平安科技(深圳)有限公司 | 运维方法、装置、电子设备及计算机可读存储介质 |
CN110287301A (zh) * | 2019-06-27 | 2019-09-27 | 上海华兴数字科技有限公司 | 故障咨询方法、装置及*** |
CN110690992A (zh) * | 2019-09-16 | 2020-01-14 | 中盈优创资讯科技有限公司 | 网络割接异常识别方法及装置 |
CN110737772A (zh) * | 2019-10-14 | 2020-01-31 | 北京首汽智行科技有限公司 | 一种问题文本处理方法 |
CN111192016A (zh) * | 2019-12-30 | 2020-05-22 | 航天信息股份有限公司广州航天软件分公司 | 一种步进式办理业务的方法及*** |
CN112491649A (zh) * | 2020-11-17 | 2021-03-12 | 中国平安财产保险股份有限公司 | 接口联调测试方法、装置、电子设备及存储介质 |
WO2022142019A1 (zh) * | 2020-12-30 | 2022-07-07 | 平安科技(深圳)有限公司 | 基于智能机器人的问题分发方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101227324A (zh) * | 2008-01-10 | 2008-07-23 | 华为技术有限公司 | 通信设备的故障信息收集方法以及通信设备和*** |
CN102708453A (zh) * | 2012-05-14 | 2012-10-03 | 北京奇虎科技有限公司 | 提供终端故障解决方案的方法及装置 |
CN102855369A (zh) * | 2011-06-30 | 2013-01-02 | 上海西门子医疗器械有限公司 | 一种故障信息的收集方法、***及医疗设备 |
CN103473409A (zh) * | 2013-08-25 | 2013-12-25 | 浙江大学 | 一种基于知识库的fpga故障自动诊断方法 |
CN105260290A (zh) * | 2015-09-28 | 2016-01-20 | 北京奇虎科技有限公司 | 应用异常信息收集方法和装置 |
CN105894203A (zh) * | 2016-03-31 | 2016-08-24 | 国网北京市电力公司 | 工单处理方法及装置 |
-
2016
- 2016-11-28 CN CN201611071663.8A patent/CN108121716A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101227324A (zh) * | 2008-01-10 | 2008-07-23 | 华为技术有限公司 | 通信设备的故障信息收集方法以及通信设备和*** |
CN102855369A (zh) * | 2011-06-30 | 2013-01-02 | 上海西门子医疗器械有限公司 | 一种故障信息的收集方法、***及医疗设备 |
CN102708453A (zh) * | 2012-05-14 | 2012-10-03 | 北京奇虎科技有限公司 | 提供终端故障解决方案的方法及装置 |
CN103473409A (zh) * | 2013-08-25 | 2013-12-25 | 浙江大学 | 一种基于知识库的fpga故障自动诊断方法 |
CN105260290A (zh) * | 2015-09-28 | 2016-01-20 | 北京奇虎科技有限公司 | 应用异常信息收集方法和装置 |
CN105894203A (zh) * | 2016-03-31 | 2016-08-24 | 国网北京市电力公司 | 工单处理方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376873A (zh) * | 2018-09-11 | 2019-02-22 | 平安科技(深圳)有限公司 | 运维方法、装置、电子设备及计算机可读存储介质 |
CN109376873B (zh) * | 2018-09-11 | 2023-08-11 | 平安科技(深圳)有限公司 | 运维方法、装置、电子设备及计算机可读存储介质 |
CN110287301A (zh) * | 2019-06-27 | 2019-09-27 | 上海华兴数字科技有限公司 | 故障咨询方法、装置及*** |
CN110690992A (zh) * | 2019-09-16 | 2020-01-14 | 中盈优创资讯科技有限公司 | 网络割接异常识别方法及装置 |
CN110690992B (zh) * | 2019-09-16 | 2022-03-29 | 中盈优创资讯科技有限公司 | 网络割接异常识别方法及装置 |
CN110737772A (zh) * | 2019-10-14 | 2020-01-31 | 北京首汽智行科技有限公司 | 一种问题文本处理方法 |
CN111192016A (zh) * | 2019-12-30 | 2020-05-22 | 航天信息股份有限公司广州航天软件分公司 | 一种步进式办理业务的方法及*** |
CN111192016B (zh) * | 2019-12-30 | 2023-12-29 | 航天信息股份有限公司广州航天软件分公司 | 一种步进式办理业务的方法及*** |
CN112491649A (zh) * | 2020-11-17 | 2021-03-12 | 中国平安财产保险股份有限公司 | 接口联调测试方法、装置、电子设备及存储介质 |
WO2022142019A1 (zh) * | 2020-12-30 | 2022-07-07 | 平安科技(深圳)有限公司 | 基于智能机器人的问题分发方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121716A (zh) | 处理问题单的方法和问题单处理*** | |
US20210019674A1 (en) | Risk profiling and rating of extended relationships using ontological databases | |
US11184241B2 (en) | Topology-aware continuous evaluation of microservice-based applications | |
US7899763B2 (en) | System, method and computer program product for evaluating a storage policy based on simulation | |
US20160094477A1 (en) | Resource provisioning planning for enterprise migration and automated application discovery | |
CN104796270B (zh) | 在云应用的问题诊断中推荐可疑组件的方法及装置 | |
US11783243B2 (en) | Targeted prioritization within a network based on user-defined factors and success rates | |
CN107196788A (zh) | 一种埋点数据的处理方法、装置、服务器及客户端 | |
US9122995B2 (en) | Classification of stream-based data using machine learning | |
US20200311134A1 (en) | Automatic construction and organization of knowledge graphs for problem diagnoses | |
US10628465B2 (en) | Generating a ranked list of best fitting place names | |
US20210158210A1 (en) | Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents | |
CN110362829A (zh) | 结构化病历数据的质量评估方法、装置及设备 | |
CN114091610A (zh) | 智能决策方法及装置 | |
CN110381310A (zh) | 一种检测视觉***的健康状态的方法及装置 | |
CN109376362A (zh) | 一种纠错文本的确定方法以及相关设备 | |
WO2022227171A1 (zh) | 关键信息提取方法、装置、电子设备及介质 | |
CN108647284A (zh) | 记录用户行为的方法及装置、介质和计算设备 | |
CN108897886A (zh) | 页面展示方法、计算设备及计算机存储介质 | |
CN109412930A (zh) | 一种im落地页的跳转方法、装置、存储介质及终端 | |
CN110298178A (zh) | 可信策略学***台 | |
CN107357649A (zh) | ***资源部署策略的确定方法、装置及电子设备 | |
CN110215703A (zh) | 游戏应用的选择方法、装置及*** | |
US20200073935A1 (en) | Generating instructional variants based on natural language processing of comments feed | |
US11893354B2 (en) | System and method for improving chatbot training dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180605 |