CN113495947B - 工单搜索方法、装置及计算设备 - Google Patents
工单搜索方法、装置及计算设备 Download PDFInfo
- Publication number
- CN113495947B CN113495947B CN202010269941.0A CN202010269941A CN113495947B CN 113495947 B CN113495947 B CN 113495947B CN 202010269941 A CN202010269941 A CN 202010269941A CN 113495947 B CN113495947 B CN 113495947B
- Authority
- CN
- China
- Prior art keywords
- searched
- work order
- word
- query
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000011218 segmentation Effects 0.000 claims abstract description 32
- 238000004891 communication Methods 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/325—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90348—Query processing by searching ordered data, e.g. alpha-numerically ordered data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及网络搜索技术领域,公开了一种工单搜索方法、装置及计算设备。该方法包括:接收推荐请求;根据所述推荐请求,获取当前工单;根据预设分词词库,对所述当前工单进行分词,以获取若干待搜索词条;确定各所述待搜索词条的权重;按照所述待搜索词条的权重由大到小的顺序对全部所述待搜索词条进行排序;根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单;根据所述目标工单的评分,显示所述目标工单。通过上述方式,本发明实施例能够提高搜索结果的准确性。
Description
技术领域
本发明实施例涉及网络搜索技术领域,具体涉及一种工单搜索方法、装置及计算设备。
背景技术
故障维护人员在接收到维护工单后,一般会根据工单的内容,输入搜索关键词,查找相似的历史案例,以获得类似的处理方法,从而提高故障的处理效率。
但是,由于故障维护人员可能来自不同的部门,可能造成业务理解上的差异,对于工单中描述的事件,不一定能够准确地以少量的搜索关键词进行概括。因此,目前的工单搜索方法会存在一定的误差,使得搜索结果不够准确。
发明内容
鉴于上述问题,本发明实施例提供了一种工单搜索方法、装置及计算设备,能够提高搜索结果的准确性。
根据本发明实施例的第一方面,提供了一种工单搜索方法,包括:接收推荐请求;根据所述推荐请求,获取当前工单;根据预设分词词库,对所述当前工单进行分词,以获取若干待搜索词条;确定各所述待搜索词条的权重;按照所述待搜索词条的权重由大到小的顺序对全部所述待搜索词条进行排序;根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单;根据所述目标工单的评分,显示所述目标工单。
在一种可选的方式中,所述确定各所述待搜索词条的权重,具体包括:根据所述待搜索词条的词库设定权重、所处位置、出现频率,计算所述待搜索词条的权重。
在一种可选的方式中,所述根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单,具体包括:若确定所述预设查询词典中存在与所述待搜索词条相同的查询词,则获取与所述查询词对应的历史工单;将所述查询词对应的历史工单确定为所述目标工单。
在一种可选的方式中,所述预设查询词典包括冲突链表;所述根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单,具体还包括:计算所述待搜索词条的哈希值;根据所述待搜索词条的哈希值,在所述预设查询词典中获取与所述待搜索词条的哈希值对应的冲突链表;若与所述待搜索词条的哈希值对应的冲突链表中存在与所述待搜索词条相同的查询词,则确定所述预设查询词典中存在与所述待搜索词条相同的查询词。
在一种可选的方式中,所述根据所述目标工单的评分,显示所述目标工单,具体包括:计算与所述查询词对应的历史工单的评分;根据所述与所述查询词对应的历史工单的评分,确定所述目标工单的评分;按照所述目标工单的评分由大到小显示所述目标工单。
在一种可选的方式中,所述计算与所述查询词对应的历史工单的评分,具体包括:根据以下公式计算与所述查询词对应的历史工单的评分:
其中,coord(q,d)为历史工单d中命中查询词t的个数,queryNorm(q)为预设查询归一参数,tf(tind)为查询词t在历史工单d出现的频率,idf(t)为查询词t在与所述查询词对应的全部历史工单d中出现的频率,t.getboost()为查询词t的预设查询权重参数,norm(t,d)为对历史工单d中单词总数分之一开平方得到的值。
在一种可选的方式中,所述方法还包括:在显示所述目标工单时,同时显示所述当前工单。
根据本发明实施例的第二方面,提供了一种工单搜索装置,包括:请求接收模块,用于接收推荐请求;当前工单获取模块,用于根据所述推荐请求,获取当前工单;分词模块,用于根据预设分词词库,对所述当前工单进行分词,以获取若干待搜索词条;权重确定模块,用于确定各所述待搜索词条的权重;排序模块,用于按照所述待搜索词条的权重由大到小的顺序对全部所述待搜索词条进行排序;搜索模块,用于根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单;显示模块,用于根据所述目标工单的评分,显示所述目标工单。
根据本发明实施例的第三方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的工单搜索方法的操作。
根据本发明实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算设备上运行时,使得计算设备执行执行上述的工单搜索方法。
本发明实施例通过按照待搜索词条的权重由大到小的顺序对全部待搜索词条进行排序,能够将最能描述当前工单内容的词条放在前面,并且按顺序依次对待搜索词条进行搜索,根据与待搜索词条对应的目标工单的评分,显示目标工单,能够将与当前工单最相近的历史工单推荐给用户,从而能够提高搜索结果的准确性。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的工单搜索方法的流程示意图;
图2示出了本发明实施例提供的哈希表项与冲突链表的对应关系示意图;
图3示出了本发明实施例提供的查询词与倒排列表的对应关系示意图;
图4示出了本发明实施例提供的工单搜索装置的结构示意图;
图5示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
由于故障维护人员不一定能够准确地以少量的搜索关键词概括工单中描述的事件,目前的工单搜索方法会存在一定的误差,使得搜索结果不够准确。
基于此,本发明实施例提供了一种工单搜索方法及***,能够提高搜索结果的准确性。
具体地,下面结合附图,对本发明实施例作进一步阐述。
其中,应当理解的是,本发明提供的下述实施例之间,只要不冲突,均可相互结合以形成新的实施方式。
图1示出了本发明实施例提供的工单搜索方法的流程示意图。该方法可以应用于计算设备。如图1所示,该方法包括:
步骤110、接收推荐请求。
其中,推荐请求为用户在工单处理界面触发的用于查询与当前工单相似的历史工单的请求。
步骤120、根据推荐请求,获取当前工单。
其中,当前工单是指当前正在处理或者正准备处理的工单。当前工单可以包括文档、表格等文本文档以及附件等等。
步骤130、根据预设分词词库,对当前工单进行分词,以获取若干待搜索词条。
其中,预设分词词库可以包括预设标准词库和预设专业词库。预设标准词库中包括若干常见、常用的单词,预设专业词库中包括若干专业领域使用的词组或单词。预设专业词库可以针对用户的需求进行定制,还可以加入一些搜索引擎的热词等。在预设标准词库和预设专业词库中可以对词或词组设置词库设定权重,例如,对某些特定的词设置较高的词库设定权重,或者,对一些搜索热度较高的词设置较高的词库设定权重。
在步骤130中,根据预设分词词库,对当前工单进行分词,以获取若干待搜索词条,具体可以为:根据预设专业词库对当前工单进行分词;根据预设标准词库对当前工单分词后剩余的内容进行再分词;将两次分词得到的词条作为待搜索词条。将当前工单分词得到的词组或者单词作为待搜索词条。例如,当前工单中包括“5G网络能力开放”,在预设专业词库中查找到“5G网络”,在预设专业词库中查找到“能力”、“开放”,则对当前工单分词得到“5G网络”、“能力”、“开放”,则待搜索词条为“5G网络”、“能力”、“开放”。
步骤140、确定各待搜索词条的权重。
其中,待搜索词条的权重是指将当前工单分词得到的词组或者单词的权重。在步骤140中,确定各待搜索词条的权重,具体可以包括:根据待搜索词条的词库设定权重、所处位置、出现频率,计算待搜索词条的权重。其中,词库设定权重是指预设标准词库或预设专业词库中设置的权重;所处位置是指该待搜索词条在当前工单中的位置,例如设置处于标题的词的权重大于处理内容的词的权重;出现频率是指该待搜索词条在当前工单中出现的次数,例如设置出现次数较多的词的权重较大。例如,待搜索词条包括“5G网络”、“能力”、“开放”,“5G网络”存在于当前工单的标题和内容,出现次数为10次,则“5G网络”的位置权重为1、频率权重为1,“能力”和“开放”存在于当前工单的内容,“能力”的出现次数为5次,“开放”的出现次数为3次,则“能力”的位置权重为0.5、频率权重为0.5,“开放”的位置权重为0.5、频率权重为0.3,并且,“5G网络”的词库设定权重为0.8,“能力”的词库设定权重为0.5,“开放”的词库设定权重为0.5,则“5G网络”的权重为0.8*1*1=0.8,“能力”的权重为0.5*0.5*0.5=0.125,“开放”的权重为0.5*0.5*0.3=0.075。
步骤150、按照待搜索词条的权重由大到小的顺序对全部待搜索词条进行排序。
在计算得到全部待搜索词条的权重后,根据待搜索词条的权重,按照由大到小的顺序对全部待搜索词条进行排序。可以将排序后的待搜索词条作为待搜索列表。通过以上方式,能够将最能提现当前工单内容的词条放在最前列。
步骤160、根据预设查询词典,按照顺序依次对待搜索词条进行搜索,以获取与待搜索词条对应的目标工单。
其中,预设查询词典用来维护历史工单集合中出现过的所有单词的相关信息,同时用来记载某个单词对应的倒排列表在倒排工单文件中的位置信息,从而通过预设查询词典搜索时,可以在预设查询词典查询待搜索词的倒排列表。
其中,预设查询词典可以包括哈希表和倒排列表。每个哈希表项保存一个指针,指针指向冲突链表,在冲突链表中,相同哈希值的单词形成链表结构。之所有会有冲突链表,是因为两个不同单词获得相同的哈希值,这在哈希算法中被称作是一次冲突,则将相同哈希值的单词存储在链表中。例如,如图2所示,图2中示出了哈希表项与冲突链表的对应关系。每个单词均对应有倒排列表,倒排列表中可以包括若干历史工单的标识。例如,单词1对应的倒排列表为:历史工单1、历史工单2、历史工单3,单词2对应的倒排列表为:历史工单1,单词3对应的倒排列表为:历史工单1、历史工单3。
其中,在步骤160之前,该方法还包括:根据历史工单,生成和更新预设查询词典。具体可以为:根据预设分词词典对历史工单进行分词,对于该历史工单中的某个词或词组,先通过哈希函数计算该词或词组的哈希值,然后根据哈希值对应的哈希表项读取其中保存的其中保存的指针,则获取对应的冲突链表,若冲突链表中存在相同的词或词组,即表明该词或词组在之前解析的历史工单中出现过,则将该历史工单添加到该词或词组的倒排列表中,若冲突链表中不存在相同的词或词组,即表明该词或词组是首次出现,则将该词或词组添加到冲突链表,并将该历史工单添加到该词或词组的倒排列表中;对所有历史工单进行相同的操作,则生成预设查询词典;同时,定时处理新出现的历史工单,则更新预设查询词典。
其中,步骤160可以包括:
步骤161、若确定预设查询词典中存在与待搜索词条相同的查询词,则获取与查询词对应的历史工单,并将查询词对应的历史工单确定为目标工单。
在一些实施例中,由于待搜索词条可能是词或词组,当待搜索词条为词组时,预设查询词典可能不存在与待搜索词条相同的查询词,则需对待搜索词条进行分词后再查询。步骤160还可以包括:
步骤162、若确定预设查询词典中不存在与待搜索词条相同的查询词,则根据预设标准词库,对待搜索词条进行分词。
步骤163、若确定预设查询词典中存在与待搜索词条的分词相同的查询词,则获取与查询词对应的历史工单,并将查询词对应的历史工单确定为目标工单。
在一些实施例中,步骤160还可以包括:
步骤164、若确定预设查询词典中不存在与待搜索词条相同的查询词,则根据预设近义词库,确定待搜索词条的近义词。
步骤165、若确定预设查询词典中存在与待搜索词条的近义词相同的查询词,则获取与查询词对应的历史工单,并将查询词对应的历史工单确定为目标工单。
在一些实施例中,步骤160还可以包括:
步骤166、若确定预设查询词典中存在与待搜索词条相同的查询词,则获取与查询词对应的历史工单,并根据预设标准词库,对待搜索词条进行分词,获取与待搜索词条的分词对应的历史工单,并根据预设近义词库,确定待搜索词条的近义词,获取与待搜索词条的近义词对应的历史工单,将获取得到的全部历史工单确定为目标工单。
具体地,确定预设查询词典中是否存在与待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)相同的查询词,具体可以为包括:计算待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)的哈希值;根据待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)的哈希值,在预设查询词典中获取与待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)的哈希值对应的冲突链表;若与待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)的哈希值对应的冲突链表中存在与待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)相同的查询词,则确定预设查询词典中存在与待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)相同的查询词。
其中,通过哈希函数可以计算待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)的哈希值。在计算得到待搜索词条(或者待搜索词条的分词或者待搜索词的近义词)的哈希值后,确定哈希值对应的哈希表项,以获取该确定的哈希表项对应的冲突链表。例如,请参阅图2,若待搜索词条为“Ederly”,计算得到待搜索词条的哈希值后,确定哈希值对应的为4号槽,则获取4号槽对应的冲突链表。查询词是指存在于冲突链表中的词。例如,请参阅图2,若待搜索词条为“Ederly”,在与待搜索词条的哈希值对应的冲突链表中查找得到与待搜索词条相同的查询词“Ederly”,则获取查询词“Ederly”对应的历史工单。
其中,对待搜索词条进行分词后获取的历史工单为若干个查询词对应的历史工单,则将全部历史工单确定为目标工单。例如,如图3所示,待搜索词条的分词包括单词1、单词2、单词3、单词4,则将单词1、单词2、单词3、单词4对应的历史工单全部确定为目标工单。
步骤170、根据目标工单的评分,显示目标工单。
其中,步骤170具体包括:计算与查询词对应的历史工单的评分;根据与查询词对应的历史工单的评分,确定目标工单的评分;按照目标工单的评分由大到小显示目标工单。通过将评分高的目标工单显示在前面,能够便于用户查找最符合的工单。
其中,可以根据以下公式计算与查询词对应的历史工单的评分:
其中,coord(q,d)为评分因子,为历史工单d中命中查询词t的个数,queryNorm(q)为预设查询归一参数,tf(tind)为查询词t在历史工单d出现的频率,idf(t)为查询词t在与查询词对应的全部历史工单d中出现的频率,t.getboost()为查询词t的预设查询权重参数,norm(t,d)为对历史工单d中单词总数分之一开平方得到的值。
其中,coord(q,d)为评分因子,基于历史工单d中出现的查询词t的个数。越多的查询词t在一个历史工单d中,则说明该历史工单d的匹配程度越高,则该历史工单d的打分越高,可以通过如下公式得出:
coord(q,d)=overlap/maxOverlay
其中,overlap为文档的标题或内容中命中检索的个数(命中重复的不算),maxOverlay为检索条件的个数,即分词后的个数。例如,若待搜索词条为“测试移动高清”,待搜索词条的分词为“测试移动高清”,若历史工单d1的标题包括“测试”,历史工单d1的内容包括“测试移动”,则历史工单d1的coord(q,d)为2/3;若历史工单d2的标题包括“测试”,历史工单d1的内容包括“步骤”,则历史工单d2的coord(q,d)为1/3。
其中,queryNorm(q)为预设查询归一参数,可以预先设置。queryNorm(q)用于计算每个查询条目的方差和。queryNorm(q)并不影响排序结果,而仅仅使得不同的评分之间可以比较。
其中,tf(tind)为查询词t在历史工单d出现的频率。若历史工单d中查询词t出现次数越多,则该历史工单d的评分越高,可以通过如下公式得出:
其中,a为搜索词在文档中出现的次数。例如,查询词为“测试”,若历史工单d1中“测试”出现的次数为2次,则历史工单d1的tf(tind)为
其中,idf(t)为查询词t与查询词对应的全部历史工单d中出现的频率,可以通过如下公式得出:
其中,numDocs为所有文档的总数,docFreq为出现了搜索词的文档数量。则docFreq越小,idf(t)越大。例如,若查询词为“测试”,全部历史工单的总数量为1000,其中标题包含“测试”的历史工单的数量为100,则idf(t)=1+log(1000/(100+1))≈1+log(1000/100)=1+log(10)=1+1=2。当存在若干个查询词时,会分别计算查询词的idf(t),然后将所有查询词的idf(t)相乘得到总的idf(t)。
其中,t.getboost()为查询词t的预设查询权重参数,可以根据用户的需要进行设置或者由***预先设置。例如,将待搜索词条设置较高的预设查询权重参数,将待搜索词条的分词以及待搜索词条的近义词设置较低的预设查询权重参数。又例如,“itemName:主机^10.0OR itemDesc:主机”中指定了itemName中词“主机”的权重是10.0,而itemDesc:主机的权重为1。
其中,norm(t,d)是长度的加权因此,用于为了将同样匹配的文档,比较短的放在比较前面。例如,历史工单d1:测试,历史工单d2:测试步骤,则当查询词为“测试”时,d1和d2均匹配,则把d1放在d2前面,因为d1更加符合完全匹配,可以通过如下公式得出:
norm(t,d)=doc.getBoost()·lengthNorm·∏f.getBoost()
其中,doc.getBoost表示文档的权重,f.getBoost表示字段的权重,若将doc.getBoost和f.getBoost都设置为1,则norm(t,d)=lengthNorm。其中,Term为文档中的一个词语,是搜索的最小单元,numTerms为文档中Term的总数。若Term的总数越多,则文档越长,则norm(t,d)越小,若Term的总数越少,则文档越短,则norm(t,d)越大。例如,历史工单d2:测试步骤,若查询词t为“测试”,则历史工单d2的norm(t,d)为
本发明实施例通过按照待搜索词条的权重由大到小的顺序对全部待搜索词条进行排序,能够将最能描述当前工单内容的词条放在前面,并且按顺序依次对待搜索词条进行搜索,根据与待搜索词条对应的目标工单的评分,显示目标工单,能够将与当前工单最相近的历史工单推荐给用户,从而能够提高搜索结果的准确性。
在一些实例中,该方法还包括:
步骤180、在显示目标工单时,同时显示当前工单。
其中,通过使得搜索后得到的目标工单与当前工单并存,能够使用户在处理当前工单时进行案例查阅,避免用户需要切换至其他功能页面进行案例推荐操作,提高了用户体验。
图4示出了本发明实施例提供的工单搜索装置的结构示意图。该装置可以应用于计算设备。如图4所示,该装置200包括:请求接收模块210、当前工单获取模块220、分词模块230、权重确定模块240、排序模块250、搜索模块260和显示模块270。
其中,请求接收模块210用于接收推荐请求;当前工单获取模块220用于根据所述推荐请求,获取当前工单;分词模块230用于根据预设分词词库,对所述当前工单进行分词,以获取若干待搜索词条;权重确定模块240用于确定各所述待搜索词条的权重;排序模块250用于按照所述待搜索词条的权重由大到小的顺序对全部所述待搜索词条进行排序;搜索模块260用于根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单;显示模块270用于根据所述目标工单的评分,显示所述目标工单。
在一种可选的方式中,权重确定模块240具体用于:根据所述待搜索词条的词库设定权重、所处位置、出现频率,计算所述待搜索词条的权重。
在一种可选的方式中,搜索模块260具体用于:若确定所述预设查询词典中存在与所述待搜索词条相同的查询词,则获取与所述查询词对应的历史工单;将所述查询词对应的历史工单确定为所述目标工单。
在一种可选的方式中,所述预设查询词典包括冲突链表;搜索模块260具体还用于:计算所述待搜索词条的哈希值;根据所述待搜索词条的哈希值,在所述预设查询词典中获取与所述待搜索词条的哈希值对应的冲突链表;若与所述待搜索词条的哈希值对应的冲突链表中存在与所述待搜索词条相同的查询词,则确定所述预设查询词典中存在与所述待搜索词条相同的查询词。
在一种可选的方式中,显示模块270具体用于:计算与所述查询词对应的历史工单的评分;根据所述与所述查询词对应的历史工单的评分,确定所述目标工单的评分;按照所述目标工单的评分由大到小显示所述目标工单。
在一种可选的方式中,显示模块270具体用于:根据以下公式计算与所述查询词对应的历史工单的评分:
其中,coord(q,d)为历史工单d中命中查询词t的个数,queryNorm(q)为预设查询归一参数,tf(tind)为查询词t在历史工单d出现的频率,idf(t)为查询词t在与所述查询词对应的全部历史工单d中出现的频率,t.getboost()为查询词t的预设查询权重参数,norm(t,d)为对历史工单d中单词总数分之一开平方得到的值。
在一种可选的方式中,显示模块270还用于:在显示所述目标工单时,同时显示所述当前工单。
需要说明的是,本发明实施例提供工单搜索装置是能够执行上述工单搜索方法的装置,则上述工单搜索方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例通过按照待搜索词条的权重由大到小的顺序对全部待搜索词条进行排序,能够将最能描述当前工单内容的词条放在前面,并且按顺序依次对待搜索词条进行搜索,根据与待搜索词条对应的目标工单的评分,显示目标工单,能够将与当前工单最相近的历史工单推荐给用户,从而能够提高搜索结果的准确性。
图5示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)302、通信接口(CommunicationsInterface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述用于工单搜索方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机可执行指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。内容传输网络包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以被处理器302调用使计算设备执行上述实施例中的工单搜索方法中的操作。
本发明实施例通过按照待搜索词条的权重由大到小的顺序对全部待搜索词条进行排序,能够将最能描述当前工单内容的词条放在前面,并且按顺序依次对待搜索词条进行搜索,根据与待搜索词条对应的目标工单的评分,显示目标工单,能够将与当前工单最相近的历史工单推荐给用户,从而能够提高搜索结果的准确性。
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在计算设备上运行时,使得计算设备执行上述任意方法实施例中的工单搜索方法。可执行指令具体可以用于使得计算设备执行上述实施例中的工单搜索方法中的操作。
本发明实施例通过按照待搜索词条的权重由大到小的顺序对全部待搜索词条进行排序,能够将最能描述当前工单内容的词条放在前面,并且按顺序依次对待搜索词条进行搜索,根据与待搜索词条对应的目标工单的评分,显示目标工单,能够将与当前工单最相近的历史工单推荐给用户,从而能够提高搜索结果的准确性。
本发明实施例提供一种工单搜索装置,用于执行上述工单搜索方法。
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使计算设备执行上述任意方法实施例中的工单搜索方法。
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的工单搜索方法。
在此提供的算法或显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (9)
1.一种工单搜索方法,其特征在于,包括:
接收推荐请求;
根据所述推荐请求,获取当前工单;
根据预设分词词库,对所述当前工单进行分词,以获取若干待搜索词条;
确定各所述待搜索词条的权重;所述确定各所述待搜索词条的权重,包括:根据所述待搜索词条的词库设定权重、所处位置、出现频率,计算所述待搜索词条的权重;所述词库设定权重是指预设标准词库或预设专业词库中设置的权重,所处位置是指该待搜索词条在当前工单中的位置,出现频率是指该待搜索词条在当前工单中出现的次数;
按照所述待搜索词条的权重由大到小的顺序对全部所述待搜索词条进行排序;
根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单;
根据所述目标工单的评分,显示所述目标工单。
2.根据权利要求1所述的方法,其特征在于,所述根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单,具体包括:
若确定所述预设查询词典中存在与所述待搜索词条相同的查询词,则获取与所述查询词对应的历史工单;
将所述查询词对应的历史工单确定为所述目标工单。
3.根据权利要求2所述的方法,其特征在于,所述预设查询词典包括冲突链表;
所述根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单,具体还包括:
计算所述待搜索词条的哈希值;
根据所述待搜索词条的哈希值,在所述预设查询词典中获取与所述待搜索词条的哈希值对应的冲突链表;
若与所述待搜索词条的哈希值对应的冲突链表中存在与所述待搜索词条相同的查询词,则确定所述预设查询词典中存在与所述待搜索词条相同的查询词。
4.根据权利要求2所述的方法,其特征在于,所述根据所述目标工单的评分,显示所述目标工单,具体包括:
计算与所述查询词对应的历史工单的评分;
根据所述与所述查询词对应的历史工单的评分,确定所述目标工单的评分;
按照所述目标工单的评分由大到小显示所述目标工单。
5.根据权利要求4所述的方法,其特征在于,所述计算与所述查询词对应的历史工单的评分,具体包括:
根据以下公式计算与所述查询词对应的历史工单的评分:
其中,coord(q,d)为历史工单d中命中查询词t的个数,queryNorm(q)为预设查询归一参数,tf(tind)为查询词t在历史工单d出现的频率,idf(t)为查询词t在与所述查询词对应的全部历史工单d中出现的频率,t.getboost()为查询词t的预设查询权重参数,norm(t,d)为对历史工单d中单词总数分之一开平方得到的值。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
在显示所述目标工单时,同时显示所述当前工单。
7.一种工单搜索装置,其特征在于,包括:
请求接收模块,用于接收推荐请求;
当前工单获取模块,用于根据所述推荐请求,获取当前工单;
分词模块,用于根据预设分词词库,对所述当前工单进行分词,以获取若干待搜索词条;
权重确定模块,用于确定各所述待搜索词条的权重;所述确定各所述待搜索词条的权重,包括:根据所述待搜索词条的词库设定权重、所处位置、出现频率,计算所述待搜索词条的权重;所述词库设定权重是指预设标准词库或预设专业词库中设置的权重,所处位置是指该待搜索词条在当前工单中的位置,出现频率是指该待搜索词条在当前工单中出现的次数;
排序模块,用于按照所述待搜索词条的权重由大到小的顺序对全部所述待搜索词条进行排序;
搜索模块,用于根据预设查询词典,按照所述顺序依次对所述待搜索词条进行搜索,以获取与所述待搜索词条对应的目标工单;
显示模块,用于根据所述目标工单的评分,显示所述目标工单。
8.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-6任一项所述的工单搜索方法的操作。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令在计算设备上运行时,使得计算设备执行如权利要求1-6任一项所述的工单搜索方法的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010269941.0A CN113495947B (zh) | 2020-04-08 | 2020-04-08 | 工单搜索方法、装置及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010269941.0A CN113495947B (zh) | 2020-04-08 | 2020-04-08 | 工单搜索方法、装置及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113495947A CN113495947A (zh) | 2021-10-12 |
CN113495947B true CN113495947B (zh) | 2024-05-10 |
Family
ID=77995633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010269941.0A Active CN113495947B (zh) | 2020-04-08 | 2020-04-08 | 工单搜索方法、装置及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113495947B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982153A (zh) * | 2012-11-29 | 2013-03-20 | 北京亿赞普网络技术有限公司 | 一种信息检索方法及其装置 |
WO2017121251A1 (zh) * | 2016-01-13 | 2017-07-20 | 北京三快在线科技有限公司 | 一种信息推送方法及装置 |
CN107798047A (zh) * | 2017-07-26 | 2018-03-13 | 上海壹账通金融科技有限公司 | 重复工单检测方法、装置、服务器和介质 |
CN108874995A (zh) * | 2018-06-12 | 2018-11-23 | 广东电网有限责任公司 | 用电客服数据库的建立方法、装置以及电子设备 |
CN109241259A (zh) * | 2018-08-24 | 2019-01-18 | 国网江苏省电力有限公司苏州供电分公司 | 基于er模型的自然语言查询方法、装置及*** |
CN109948036A (zh) * | 2017-11-15 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 一种分词词项权重的计算方法和装置 |
CN110222203A (zh) * | 2019-06-19 | 2019-09-10 | 深圳前海微众银行股份有限公司 | 元数据搜索方法、装置、设备及计算机可读存储介质 |
CN110826735A (zh) * | 2019-10-31 | 2020-02-21 | 上海玖道信息科技股份有限公司 | 一种电力scada智能多维查询检修方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10810600B2 (en) * | 2015-12-16 | 2020-10-20 | Bmc Software, Inc. | Using multi-factor context for resolving customer service issues |
US10891324B2 (en) * | 2018-09-21 | 2021-01-12 | International Business Machines Corporation | Weighting of unobserved terms in a language model for information retrieval using lexical resources |
-
2020
- 2020-04-08 CN CN202010269941.0A patent/CN113495947B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982153A (zh) * | 2012-11-29 | 2013-03-20 | 北京亿赞普网络技术有限公司 | 一种信息检索方法及其装置 |
WO2017121251A1 (zh) * | 2016-01-13 | 2017-07-20 | 北京三快在线科技有限公司 | 一种信息推送方法及装置 |
CN107798047A (zh) * | 2017-07-26 | 2018-03-13 | 上海壹账通金融科技有限公司 | 重复工单检测方法、装置、服务器和介质 |
CN109948036A (zh) * | 2017-11-15 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 一种分词词项权重的计算方法和装置 |
CN108874995A (zh) * | 2018-06-12 | 2018-11-23 | 广东电网有限责任公司 | 用电客服数据库的建立方法、装置以及电子设备 |
CN109241259A (zh) * | 2018-08-24 | 2019-01-18 | 国网江苏省电力有限公司苏州供电分公司 | 基于er模型的自然语言查询方法、装置及*** |
CN110222203A (zh) * | 2019-06-19 | 2019-09-10 | 深圳前海微众银行股份有限公司 | 元数据搜索方法、装置、设备及计算机可读存储介质 |
CN110826735A (zh) * | 2019-10-31 | 2020-02-21 | 上海玖道信息科技股份有限公司 | 一种电力scada智能多维查询检修方法 |
Non-Patent Citations (1)
Title |
---|
"基于自然语言处理技术的电力客户投诉工单文本挖掘分析";吴刚勇 等;《中国设备工程》;20180910;第154-156页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113495947A (zh) | 2021-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019091026A1 (zh) | 知识库文档快速检索方法、应用服务器及计算机可读存储介质 | |
JP4809441B2 (ja) | ユーザログからの検索カテゴリ同義語の推定 | |
US8819047B2 (en) | Fact verification engine | |
US8606778B1 (en) | Document ranking based on semantic distance between terms in a document | |
US20180341866A1 (en) | Method of building a sorting model, and application method and apparatus based on the model | |
US9031935B2 (en) | Search system, search method, and program | |
US7996379B1 (en) | Document ranking using word relationships | |
CN110716991B (zh) | 基于电子书的实体关联信息的展示方法及电子设备 | |
US20110258202A1 (en) | Concept extraction using title and emphasized text | |
CN107870915B (zh) | 对搜索结果的指示 | |
US20110145269A1 (en) | System and method for quickly determining a subset of irrelevant data from large data content | |
US6278990B1 (en) | Sort system for text retrieval | |
CN112925883B (zh) | 搜索请求处理方法、装置、电子设备及可读存储介质 | |
CN113988157A (zh) | 语义检索网络训练方法、装置、电子设备及存储介质 | |
CN105653553B (zh) | 词权重生成方法和装置 | |
US11151317B1 (en) | Contextual spelling correction system | |
CN109522275B (zh) | 基于用户生产内容的标签挖掘方法、电子设备及存储介质 | |
CN113495947B (zh) | 工单搜索方法、装置及计算设备 | |
CN115563515B (zh) | 文本相似性检测方法、装置、设备及存储介质 | |
CN115186163B (zh) | 搜索结果排序模型的训练与搜索结果排序方法、装置 | |
CN115906817A (zh) | 一种跨语言环境的关键字匹配方法、装置及电子设备 | |
CN111859066B (zh) | 一种运维工单的查询推荐方法及装置 | |
CN113177061A (zh) | 一种搜索方法、装置和电子设备 | |
US20130091166A1 (en) | Method and apparatus for indexing information using an extended lexicon | |
CN115905577B (zh) | 知识图谱的构建方法及装置、法规检索方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |