CN117034949A - 咨询工单的分类方法、装置、电子设备及存储介质 - Google Patents

咨询工单的分类方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117034949A
CN117034949A CN202311040774.2A CN202311040774A CN117034949A CN 117034949 A CN117034949 A CN 117034949A CN 202311040774 A CN202311040774 A CN 202311040774A CN 117034949 A CN117034949 A CN 117034949A
Authority
CN
China
Prior art keywords
work order
target
tool
field
consultation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311040774.2A
Other languages
English (en)
Inventor
赵文怡
朱芳鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202311040774.2A priority Critical patent/CN117034949A/zh
Publication of CN117034949A publication Critical patent/CN117034949A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种咨询工单的分类方法、装置、电子设备及存储介质,涉及人工智能技术领域、金融科技领域或其他相关领域。方法包括:获取目标咨询工单的工单文本,工单文本包括目标咨询工单的标题文本和正文文本;通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域,工单领域为工具使用领域或者数据湖使用领域;根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息;根据工单领域和语义信息,确定目标咨询工单对应的工单类型。通过预设正则表达式和语义识别处理确定目标咨询工单对应的工单类型,可以快速的对咨询工单进行分类,提高了咨询工单分类的效率。

Description

咨询工单的分类方法、装置、电子设备及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种咨询工单的分类方法、装置、电子设备及存储介质。
背景技术
咨询工单是指由业务人员提供的、用于咨询技术问题的工单。当服务支持人员接收到咨询工单后,需要根据自身经验或者通过数据库检索的方式来判断咨询工单所属的工单类型,然后根据不同的工单类型向对口的技术人员寻求技术支持。
随着数字化和信息化的不断推进,咨询工单的数量呈爆发式增长,通过人工判断咨询工单所属的工单类型的效率较低。
发明内容
本申请提供一种咨询工单的分类方法、装置、电子设备及存储介质,用于提升工单类型判断的效率。
第一方面,本申请提供一种咨询工单的分类方法,包括:
获取目标咨询工单的工单文本,所述工单文本包括所述目标咨询工单的标题文本和正文文本;
通过预设正则表达式对所述工单文本进行匹配处理,得到所述目标咨询工单所属的工单领域,所述工单领域为工具使用领域或者数据湖使用领域;
根据所述工单领域对所述工单文本进行语义识别处理,得到所述目标咨询工单的语义信息;
根据所述工单领域和所述语义信息,确定所述目标咨询工单对应的工单类型。
在一种可能的实现方式中,根据所述工单领域和所述语义信息,确定所述目标咨询工单对应的工单类型,包括:
生成所述语义信息对应的语义标签;
若所述工单领域为所述工具使用领域,则根据所述工单文本确定所述目标咨询工单对应的目标工具,并对所述工单领域、所述目标工具的标识和所述语义标签进行组合处理,确定所述工单类型;
若所述工单领域为所述数据湖使用领域,则将所述工单领域和所述语义标签进行组合处理,得到所述工单类型。
在一种可能的实现方式中,根据所述工单文本确定所述目标咨询工单对应的目标工具,包括:
获取多个预设工具、以及每个预设工具对应的至少一个工具关键词;
根据所述多个工单文本、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具。
在一种可能的实现方式中,根据所述多个工单文本、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具,包括:
获取所述工单文本对应的多个工单词汇、以及每个工单词汇的词汇类型;
根据每个工单词汇的词汇类型,在所述多个工单词汇中确定至少一个目标词汇,所述目标词汇的词汇类型为名词类型;
根据所述至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具。
在一种可能的实现方式中,根据所述至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具,包括:
对所述多个预设工具进行排序;
判断所述至少一个目标词汇与第i个预设工具对应的至少一个工具关键词中是否存在相同词汇,若是,则将所述第i个预设工具确定为所述目标工具;其中,所述i依次取1、2、……,直至确定得到所述目标工具。
在一种可能的实现方式中,对所述多个预设工具进行排序,包括:
确定历史时段内每个预设工具对应的历史咨询工单的工单数量;
按照工单数量从大到小的顺序,对所述多个预设工具进行排序。
在一种可能的实现方式中,根据所述工单领域对所述工单文本进行语义识别处理,得到所述目标咨询工单的语义信息,包括:
对所述工单文本进行分词处理,得到多个工单词汇;
对所述多个工单词汇进行拼接处理,得到所述工单文本对应的工单词向量;
根据所述工单领域对所述工单词向量进行语义识别处理,得到所述语义信息。
在一种可能的实现方式中,根据所述工单领域对所述工单词向量进行语义识别处理,得到所述语义信息,包括:
获取所述工单领域对应的语义识别模型,所述语义识别模型为对所述工单领域中的多组样本进行训练得到的;
通过所述语义识别模型对所述工单词向量进行语义识别处理,得到所述语义信息。
在一种可能的实现方式中,通过预设正则表达式对所述工单文本进行匹配处理,得到所述目标咨询工单所属的工单领域,包括:
通过所述预设正则表达式对所述工单文本中的词汇进行匹配处理,以判断所述工单文本中是否存在预设关键词;
若所述工单文本中存在预设关键词,则确定所述预设关键词所在的关键词集合,并将所述关键词集合对应的领域确定为所述工单领域。
第二方面,本申请提供一种咨询工单的分类装置,包括:
获取模块,用于获取目标咨询工单的工单文本,所述工单文本包括所述目标咨询工单的标题文本和正文文本;
第一处理模块,用于通过预设正则表达式对所述工单文本进行匹配处理,得到所述目标咨询工单所属的工单领域,所述工单领域为工具使用领域或者数据湖使用领域;
第二处理模块,用于根据所述工单领域对所述工单文本进行语义识别处理,得到所述目标咨询工单的语义信息;
确定模块,用于根据所述工单领域和所述语义信息,确定所述目标咨询工单对应的工单类型。
在一种可能的实施方式中,所述确定模块,具体用于:
生成所述语义信息对应的语义标签;
若所述工单领域为所述工具使用领域,则根据所述工单文本确定所述目标咨询工单对应的目标工具,并对所述工单领域、所述目标工具的标识和所述语义标签进行组合处理,确定所述工单类型;
若所述工单领域为所述数据湖使用领域,则将所述工单领域和所述语义标签进行组合处理,得到所述工单类型。
在一种可能的实施方式中,所述确定模块,具体用于:
获取多个预设工具、以及每个预设工具对应的至少一个工具关键词;
根据所述多个工单文本、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具。
在一种可能的实施方式中,所述确定模块,具体用于:
获取所述工单文本对应的多个工单词汇、以及每个工单词汇的词汇类型;
根据每个工单词汇的词汇类型,在所述多个工单词汇中确定至少一个目标词汇,所述目标词汇的词汇类型为名词类型;
根据所述至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具。
在一种可能的实施方式中,所述确定模块,具体用于:
对所述多个预设工具进行排序;
判断所述至少一个目标词汇与第i个预设工具对应的至少一个工具关键词中是否存在相同词汇,若是,则将所述第i个预设工具确定为所述目标工具;其中,所述i依次取1、2、……,直至确定得到所述目标工具。
在一种可能的实施方式中,所述确定模块,具体用于:
确定历史时段内每个预设工具对应的历史咨询工单的工单数量;
按照工单数量从大到小的顺序,对所述多个预设工具进行排序。
在一种可能的实施方式中,所述第二处理模块,具体用于:
对所述工单文本进行分词处理,得到多个工单词汇;
对所述多个工单词汇进行拼接处理,得到所述工单文本对应的工单词向量;
根据所述工单领域对所述工单词向量进行语义识别处理,得到所述语义信息。
在一种可能的实施方式中,所述第二处理模块,具体用于:
获取所述工单领域对应的语义识别模型,所述语义识别模型为对所述工单领域中的多组样本进行训练得到的;
通过所述语义识别模型对所述工单词向量进行语义识别处理,得到所述语义信息。
在一种可能的实施方式中,所述第一处理模块,具体用于:
通过所述预设正则表达式对所述工单文本中的词汇进行匹配处理,以判断所述工单文本中是否存在预设关键词;
若所述工单文本中存在预设关键词,则确定所述预设关键词所在的关键词集合,并将所述关键词集合对应的领域确定为所述工单领域。
第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现第一方面中任一项所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行如第一方面中任一项所述的方法。
第五方面,本申请提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行如第一方面中任一项所述的方法。
本申请提供的咨询工单的分类方法、装置、电子设备及存储介质,方法包括:获取目标咨询工单的工单文本,工单文本包括目标咨询工单的标题文本和正文文本;通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域,工单领域为工具使用领域或者数据湖使用领域;根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息;根据工单领域和语义信息,确定目标咨询工单对应的工单类型。通过预设正则表达式和语义识别处理确定目标咨询工单对应的工单类型,可以快速的对咨询工单进行分类,提高了咨询工单分类的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种咨询工单的分类方法的流程示意图;
图2为本申请实施例提供的一种咨询工单分类的示意图;
图3为本申请实施例提供的另一种咨询工单分类的示意图;
图4为本申请实施例提供的另一种咨询工单的分类方法的流程示意图;
图5为本申请实施例提供的一种咨询工单的分类装置的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请中“至少一个”是指一个或多个。“多个”是指两个或两个以上。
在本申请中,“示例的”、“在一些实施例中”、“例如”、“在另一些实施例中”等用于表示作例子、例证或说明。本申请中被描述为“示例”或“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用示例的一词旨在以具体方式呈现概念。
需要说明的是,本申请的咨询工单的分类方法、装置、电子设备及存储介质可用于人工智能技术领域,也可以用于除人工智能技术领域之外的任意领域,本申请的咨询工单的分类方法、装置、电子设备及存储介质的应用领域不作限定。
本申请的应用场景可以是各个企业、机构等对工单进行分类,例如银行对咨询工单进行分类。需要说明的是,本申请所提供的咨询工单的分类方法,不仅可以用于咨询工单分类场景,还可以应用于其他分类场景,本申请所提供的咨询工单的分类方法包括但不限于以上应用场景。
在相关技术中,通常是由服务支持人员根据自身经验或者通过数据库检索的方式来判断咨询工单所属的工单类型,随着数字化和信息化的不断推进,咨询工单的数量呈爆发式增长,通过人工判断咨询工单所属的工单类型的效率较低。
为了解决上述技术问题,本申请实施例提供一种咨询工单的分类方法,通过预设正则表达式和语义识别处理确定目标咨询工单对应的工单类型,可以快速的对咨询工单进行分类,提高了咨询工单分类的效率。
本申请提供的咨询工单的分类方法,旨在解决现有技术的如上技术问题。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。在本申请的描述中,除非另有明确的规定和限定,各术语应在本领域内做广义理解。下面将结合附图,对本申请的实施例进行描述。
图1为本申请实施例提供的一种咨询工单的分类方法的流程示意图。请参见图1,该方法包括以下步骤:
S101、获取目标咨询工单的工单文本,工单文本包括目标咨询工单的标题文本和正文文本。
作为示例,该实施例的执行主体可以为咨询工单的分类装置,该咨询工单的分类装置的实现有多种。例如,可以为程序软件,也可以为存储有相关计算机程序的介质,例如,U盘等;或者,该装置还可以为集成或安装有相关计算机程序的实体设备,例如,芯片、智能终端、电脑、服务器等。
可以从工单***或知识库中获取目标咨询工单的工单文本。
工单***中的咨询工单可以为未处理的咨询工单,知识库中的咨询工单可以为已处理的咨询工单。
当从工单***中获取目标咨询工单时,可以是为了对目标咨询工单进行分类;当从知识库中获取目标咨询工单时,可以是为了验证当前的分类方法的准确度,并可以根据准确度对当前的分类方法进行优化,以便可以准确、快速的对咨询工单进行分类。
示例性的,目标咨询工单的工单文本可以如表1所示:
表1
S102、通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域,工单领域为工具使用领域或者数据湖使用领域。
预设正则表达式可以是用来从文本中选取与预设的字符串相匹配的字符串。
示例性的,预设正则表达式可以是用来选取数据湖名称或工具名称的。
工单领域可以为目标咨询工单所属的领域,通过工单领域可以划分不同的咨询工单。
工具使用领域可以是指使用工具的领域。
若咨询工单属于工单使用领域,则说明咨询工单是用于咨询工具相关问题的工单。
若咨询工单属于数据湖使用领域,则说明咨询工单是用于咨询数据湖相关问题的工单。
在一种可能的实现方式中,可以通过以下方式通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域:
通过预设正则表达式对工单文本中的词汇进行匹配处理,以判断工单文本中是否存在预设关键词;若工单文本中存在预设关键词,则确定预设关键词所在的关键词集合,并将关键词集合对应的领域确定为工单领域。
关键字集合的数量与工单领域的数量相同。
可以事先建立每个工单领域对应的关键字集合。
示例性的,若工单领域为工具使用领域,则工单使用领域对应的关键字集合可以包括多个工具的名称。
在一种可能的实现方式中,可以通过预设正则表达式先对工单文本中的标题文本进行匹配,若标题文本中存在预设关键词,则可以确定预设关键词所在的关键词集合,并将预设关键词集合对应的领域确定为工单领域;若标题文本中不存在预设关键词,则可以通过预设正则表达式匹配正文文本,根据正文文本中存在的预设关键词确定关键词集合,并将预设关键词集合对应的领域确定为工单领域。
示例性的,目标咨询工单的工单文本和目标咨询工单所属工单领域如表2所示:
表2
当工单文本如工单序号1所示时,可以使用预设正则表达式对标题文本的词汇进行匹配,标题文本中存在预设关键词分析工具1,由于分析工具1属于工具使用领域对应的关键词集合,因此,可以确定工单序号为1的咨询工单的工单领域为工具使用领域。
当工单文本如工单序号2所示时,可以使用预设正则表达式对标题文本的词汇进行匹配,标题文本中存在预设关键词分析工具2,由于分析工具2属于工具使用领域对应的关键词集合,因此,可以确定工单序号为2的咨询工单的工单领域为工具使用领域。
当工单文本如工单序号3所示时,可以使用预设正则表达式对标题文本的词汇进行匹配,标题文本中存在预设关键词数据湖,由于数据湖属于数据湖使用领域对应的关键词集合,因此,可以确定工单序号为3的咨询工单的工单领域为数据湖使用领域。
当工单文本如工单序号4所示时,可以使用预设正则表达式对标题文本的词汇进行匹配,标题文本中存在预设关键词数据湖,由于数据湖属于数据湖使用领域对应的关键词集合,因此,可以确定工单序号为4的咨询工单的工单领域为数据湖使用领域。
S103、根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息。
语义信息可以用于指示目标咨询工单的工单类型。
不同工具领域的咨询工单的语义信息可以不同。
示例性的,目标咨询工单的工单文本和目标咨询工单的语义信息如表3所示:
表3
在一种可能的实现方式中,可以通过FastText算法对工单文本进行语义识别处理,以得到目标咨询工单的语义信息。
S104、根据工单领域和语义信息,确定目标咨询工单对应的工单类型。
在一种可能的实现方式中,可以通过以下方式根据工单领域和语义信息,确定目标咨询工单对应的工单类型:
生成语义信息对应的语义标签;若工单领域为工具使用领域,则根据工单文本确定目标咨询工单对应的目标工具,并对工单领域、目标工具的标识和语义标签进行组合处理,确定工单类型;若工单领域为数据湖使用领域,则将工单领域和语义标签进行组合处理,得到工单类型。
语义标签可以是一种简化后的语义信息。当语义信息较短时,其可以直接作为语义标签使用。
语义信息包含的字数大于或等于语义标签所包含的字数。
语义标签可以是由分类装置根据学习情况设定,也可以是由人为设定,本申请对此不作限定。
可以通过预设正则表达式确定目标咨询工单对应的目标工具。
针对工具使用领域类的目标咨询工单,其工单类型可以由工单领域、目标工具的标识和语义标签拼接而成,如图2所示。
示例性的,如表3中工单序号为4的咨询工单,其工单领域为工具使用领域,其目标工具的标识为分析工具1,其语义标签为***环境和需求咨询,则可以确定其工单类型为工具使用领域-分析工具1-***环境和需求咨询。
又一示例的,如表3中工单序号为5的咨询工单,其工单领域为工具使用领域,其目标工具的标识为分析工具2,其语义标签为产品使用咨询,则可以确定其工单类型为工具使用领域-分析工具2-产品使用咨询。
再一示例的,如表3中工单序号为6的咨询工单,其工单领域为工具使用领域,其目标工具的标识为工具3,其语义标签为开户接入咨询,则可以确定其工单类型为工具使用领域-工具3-开户接入咨询。
针对数据湖使用领域类的目标咨询工单,其工单类型可以由工单类型和语义标签拼接而成,如图3所示。
示例性的,如表2中工单序号为4的咨询工单,其工单领域为数据湖使用领域,其语义标签为取数逻辑咨询,则可以确定其工单类型为数据湖使用领域-取数逻辑咨询。
又一示例的,如表3中工单序号为1的咨询工单,其工单领域为数据湖使用领域,其语义标签为结构化查询语言(Structured Query Language,SQL)语句报错咨询,则可以确定其工单类型为数据湖使用领域-SQL语句报错咨询。
再一示例的,如表3中工单序号为2的咨询工单,其工单领域为数据湖使用领域,其语义标签为数据权限咨询,则可以确定其工单类型可以为数据湖使用领域-数据权限咨询。
在图1所示的实施例中,获取目标咨询工单的工单文本,工单文本包括目标咨询工单的标题文本和正文文本;通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域,工单领域为工具使用领域或者数据湖使用领域;根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息;根据工单领域和语义信息,确定目标咨询工单对应的工单类型。通过预设正则表达式和语义识别处理确定目标咨询工单对应的工单类型,可以快速的对咨询工单进行分类,提高了咨询工单分类的效率,减轻了服务支持人员的工作量,并为后续积累各领域问题、构建问答知识库,实现工单自动应答提供分类和数据基础。
在上述任意一个实施例的基础上,下面,结合图4,对咨询工单的分类的详细过程进行说明。
图4为本申请实施例提供的另一种咨询工单的分类方法的流程示意图。请参见图4,该方法包括以下步骤:
S401、获取目标咨询工单的工单文本,工单文本包括目标咨询工单的标题文本和正文文本。
需要说明的是,S401的执行过程可以参见S101的执行过程,此处不再进行赘述。
S402、通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域,工单领域为工具使用领域或者数据湖使用领域。
需要说明的是,S402的执行过程可以参见S102的执行过程,此处不再进行赘述。
S403、根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息。
在一种可能的实现方式中,可以通过以下方式根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息:
对工单文本进行分词处理,得到多个工单词汇;对多个工单词汇进行拼接处理,得到工单文本对应的工单词向量;根据工单领域对工单词向量进行语义识别处理,得到语义信息。
不同工单领域得到的语义信息可以不同。
在一种可能的实现方式中,可以通过以下方式根据工单领域对工单词向量进行语义识别处理,得到语义信息:
获取工单领域对应的语义识别模型,语义识别模型为对工单领域中的多组样本进行训练得到的;通过语义识别模型对工单词向量进行语义识别处理,得到语义信息。
语义识别模型可以是FastText模型。
不同工单领域对应的语义识别模型不同。
针对不同的工单领域,可以训练得到相应的语义识别模型。
可以通过模型名称或者是工单领域与语义识别模型之间的对应关系等获取工单领域对应的语义识别模型。
S404、生成语义信息对应的语义标签。
针对工具使用领域的工单,其语义标签可以包括:***环境和需求咨询、产品使用咨询和开户接入咨询。
针对数据湖使用领域的工单,其语义标签可以包括:SQL语句报错咨询、取数逻辑咨询、数据权限咨询。
语义标签可以根据实际情况设定,本申请对此不作限定。
S405、若工单领域为工具使用领域,则根据工单文本确定目标咨询工单对应的目标工具,并对工单领域、目标工具的标识和语义标签进行组合处理,确定工单类型。
在一种可能的实现方式中,可以通过以下方式根据工单文本确定目标咨询工单对应的目标工具:
获取多个预设工具、以及每个预设工具对应的至少一个工具关键词;根据多个工单文本、以及每个预设工具对应的至少一个工具关键词,在多个预设工具中确定目标工具。
工具关键词可以是预设工具的名称、中文简称或英文简称等。
预设工具可以是指在企业运维过程中需要使用到的软件工具。
在一种可能的实现方式中,可以通过以下方式根据多个工单文本、以及每个预设工具对应的至少一个工具关键词,在多个预设工具中确定目标工具:
获取工单文本对应的多个工单词汇、以及每个工单词汇的词汇类型;根据每个工单词汇的词汇类型,在多个工单词汇中确定至少一个目标词汇,目标词汇的词汇类型为名词类型;根据至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在多个预设工具中确定目标工具。
词汇类型可以是名词类型、动词类型,形容词类型、语气词类型等。
先通过词汇类型在多个工单词汇中确定至少一个目标词汇,可以减少最终词汇的匹配量,提高了分类的整体效率。
在一种可能的实现方式中,可以通过以下方式根据至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在多个预设工具中确定目标工具:
对多个预设工具进行排序;判断至少一个目标词汇与第i个预设工具对应的至少一个工具关键词中是否存在相同词汇,若是,则将第i个预设工具确定为目标工具;其中,i依次取1、2、……,直至确定得到目标工具。
示例性的,若至少一个目标词汇包括分析工具1、分析工具2和工具3,第1个预设工具对应的工具关键词为预设工具1,则可以将第1个预设工具确定为目标工具。
在确定得到目标工具之后,就不在进行词汇匹配了,节省了资源。
在一种可能的实现方式中,可以通过以下方式对多个预设工具进行排序:
确定历史时段内每个预设工具对应的历史咨询工单的工单数量;按照工单数量从大到小的顺序,对多个预设工具进行排序。
通过对多个预设工具进行排序,可以将询问较多的工具排在前面,在一定程度上可以快速确定得到目标工具。
示例性的,目标咨询工单的工单文本和目标咨询工单的目标工具如表4所示:
表4
S406、若工单领域为数据湖使用领域,则将工单领域和语义标签进行组合处理,得到工单类型。
在图4所示的实施例中,获取目标咨询工单的工单文本,工单文本包括目标咨询工单的标题文本和正文文本;通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域,工单领域为工具使用领域或者数据湖使用领域;根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息;生成语义信息对应的语义标签;若工单领域为工具使用领域,则根据工单文本确定目标咨询工单对应的目标工具,并对工单领域、目标工具的标识和语义标签进行组合处理,确定工单类型;若工单领域为数据湖使用领域,则将工单领域和语义标签进行组合处理,得到工单类型。通过预设正则表达式和语义识别处理确定目标咨询工单对应的工单类型,可以快速的对咨询工单进行分类,提高了咨询工单分类的效率,减轻了服务支持人员的工作量,并为后续积累各领域问题、构建问答知识库,实现工单自动应答提供分类和数据基础。
图5为本申请实施例提供的一种咨询工单的分类装置的结构示意图。如图5所示,该咨询工单的分类装置50可以包括:获取模块51、第一处理模块52、第二处理模块53以及确定模块54,其中,
获取模块51,用于获取目标咨询工单的工单文本,工单文本包括目标咨询工单的标题文本和正文文本;
第一处理模块52,用于通过预设正则表达式对工单文本进行匹配处理,得到目标咨询工单所属的工单领域,工单领域为工具使用领域或者数据湖使用领域;
第二处理模块53,用于根据工单领域对工单文本进行语义识别处理,得到目标咨询工单的语义信息;
确定模块54,用于根据工单领域和语义信息,确定目标咨询工单对应的工单类型。
在一种可能的实施方式中,确定模块54,具体用于:
生成语义信息对应的语义标签;
若工单领域为工具使用领域,则根据工单文本确定目标咨询工单对应的目标工具,并对工单领域、目标工具的标识和语义标签进行组合处理,确定工单类型;
若工单领域为数据湖使用领域,则将工单领域和语义标签进行组合处理,得到工单类型。
在一种可能的实施方式中,确定模块54,具体用于:
获取多个预设工具、以及每个预设工具对应的至少一个工具关键词;
根据多个工单文本、以及每个预设工具对应的至少一个工具关键词,在多个预设工具中确定目标工具。
在一种可能的实施方式中,确定模块54,具体用于:
获取工单文本对应的多个工单词汇、以及每个工单词汇的词汇类型;
根据每个工单词汇的词汇类型,在多个工单词汇中确定至少一个目标词汇,目标词汇的词汇类型为名词类型;
根据至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在多个预设工具中确定目标工具。
在一种可能的实施方式中,确定模块54,具体用于:
对多个预设工具进行排序;
判断至少一个目标词汇与第i个预设工具对应的至少一个工具关键词中是否存在相同词汇,若是,则将第i个预设工具确定为目标工具;其中,i依次取1、2、……,直至确定得到目标工具。
在一种可能的实施方式中,确定模块54,具体用于:
确定历史时段内每个预设工具对应的历史咨询工单的工单数量;
按照工单数量从大到小的顺序,对多个预设工具进行排序。
在一种可能的实施方式中,第二处理模块53,具体用于:
对工单文本进行分词处理,得到多个工单词汇;
对多个工单词汇进行拼接处理,得到工单文本对应的工单词向量;
根据工单领域对工单词向量进行语义识别处理,得到语义信息。
在一种可能的实施方式中,第二处理模块53,具体用于:
获取工单领域对应的语义识别模型,语义识别模型为对工单领域中的多组样本进行训练得到的;
通过语义识别模型对工单词向量进行语义识别处理,得到语义信息。
在一种可能的实施方式中,第一处理模块52,具体用于:
通过预设正则表达式对工单文本中的词汇进行匹配处理,以判断工单文本中是否存在预设关键词;
若工单文本中存在预设关键词,则确定预设关键词所在的关键词集合,并将关键词集合对应的领域确定为工单领域。
需要说明的是,本申请实施例所示的咨询工单的分类装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
图6为本申请实施例中提供的一种电子设备的结构示意图,如图6所示,该电子设备60包括:
处理器(processor)61,电子设备还包括了存储器(memory)62;还可以包括通信接口(Communication Interface)63和总线64。其中,处理器61、存储器62、通信接口63、可以通过总线64完成相互间的通信。通信接口63可以用于信息传输。处理器61可以调用存储器62中的逻辑指令,以执行上述实施例的方法。
此外,上述的存储器62中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器62作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本申请实施例中的方法对应的程序指令/模块。处理器61通过运行存储在存储器62中的软件程序、指令以及模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器62可包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器62可以包括高速随机存取存储器,还可以包括非易失性存储器。
本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时实现如前述实施例的方法。
本申请实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如前述实施例的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
需要说明的是,本申请的技术方案中,所涉及的金融数据或用户数据等信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (12)

1.一种咨询工单的分类方法,其特征在于,包括:
获取目标咨询工单的工单文本,所述工单文本包括所述目标咨询工单的标题文本和正文文本;
通过预设正则表达式对所述工单文本进行匹配处理,得到所述目标咨询工单所属的工单领域,所述工单领域为工具使用领域或者数据湖使用领域;
根据所述工单领域对所述工单文本进行语义识别处理,得到所述目标咨询工单的语义信息;
根据所述工单领域和所述语义信息,确定所述目标咨询工单对应的工单类型。
2.根据权利要求1所述的方法,其特征在于,根据所述工单领域和所述语义信息,确定所述目标咨询工单对应的工单类型,包括:
生成所述语义信息对应的语义标签;
若所述工单领域为所述工具使用领域,则根据所述工单文本确定所述目标咨询工单对应的目标工具,并对所述工单领域、所述目标工具的标识和所述语义标签进行组合处理,确定所述工单类型;
若所述工单领域为所述数据湖使用领域,则将所述工单领域和所述语义标签进行组合处理,得到所述工单类型。
3.根据权利要求2所述的方法,其特征在于,根据所述工单文本确定所述目标咨询工单对应的目标工具,包括:
获取多个预设工具、以及每个预设工具对应的至少一个工具关键词;
根据所述多个工单文本、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具。
4.根据权利要求3所述的方法,其特征在于,根据所述多个工单文本、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具,包括:
获取所述工单文本对应的多个工单词汇、以及每个工单词汇的词汇类型;
根据每个工单词汇的词汇类型,在所述多个工单词汇中确定至少一个目标词汇,所述目标词汇的词汇类型为名词类型;
根据所述至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具。
5.根据权利要求4所述的方法,其特征在于,根据所述至少一个目标词汇、以及每个预设工具对应的至少一个工具关键词,在所述多个预设工具中确定所述目标工具,包括:
对所述多个预设工具进行排序;
判断所述至少一个目标词汇与第i个预设工具对应的至少一个工具关键词中是否存在相同词汇,若是,则将所述第i个预设工具确定为所述目标工具;其中,所述i依次取1、2、……,直至确定得到所述目标工具。
6.根据权利要求5所述的方法,其特征在于,对所述多个预设工具进行排序,包括:
确定历史时段内每个预设工具对应的历史咨询工单的工单数量;
按照工单数量从大到小的顺序,对所述多个预设工具进行排序。
7.根据权利要求1-6任一项所述的方法,其特征在于,根据所述工单领域对所述工单文本进行语义识别处理,得到所述目标咨询工单的语义信息,包括:
对所述工单文本进行分词处理,得到多个工单词汇;
对所述多个工单词汇进行拼接处理,得到所述工单文本对应的工单词向量;
根据所述工单领域对所述工单词向量进行语义识别处理,得到所述语义信息。
8.根据权利要求7所述的方法,其特征在于,根据所述工单领域对所述工单词向量进行语义识别处理,得到所述语义信息,包括:
获取所述工单领域对应的语义识别模型,所述语义识别模型为对所述工单领域中的多组样本进行训练得到的;
通过所述语义识别模型对所述工单词向量进行语义识别处理,得到所述语义信息。
9.根据权利要求1-8任一项所述的方法,其特征在于,通过预设正则表达式对所述工单文本进行匹配处理,得到所述目标咨询工单所属的工单领域,包括:
通过所述预设正则表达式对所述工单文本中的词汇进行匹配处理,以判断所述工单文本中是否存在预设关键词;
若所述工单文本中存在预设关键词,则确定所述预设关键词所在的关键词集合,并将所述关键词集合对应的领域确定为所述工单领域。
10.一种咨询工单的分类装置,其特征在于,包括:
获取模块,用于获取目标咨询工单的工单文本,所述工单文本包括所述目标咨询工单的标题文本和正文文本;
第一处理模块,用于通过预设正则表达式对所述工单文本进行匹配处理,得到所述目标咨询工单所属的工单领域,所述工单领域为工具使用领域或者数据湖使用领域;
第二处理模块,用于根据所述工单领域对所述工单文本进行语义识别处理,得到所述目标咨询工单的语义信息;
确定模块,用于根据所述工单领域和所述语义信息,确定所述目标咨询工单对应的工单类型。
11.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-9中任一项所述的方法。
CN202311040774.2A 2023-08-17 2023-08-17 咨询工单的分类方法、装置、电子设备及存储介质 Pending CN117034949A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311040774.2A CN117034949A (zh) 2023-08-17 2023-08-17 咨询工单的分类方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311040774.2A CN117034949A (zh) 2023-08-17 2023-08-17 咨询工单的分类方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117034949A true CN117034949A (zh) 2023-11-10

Family

ID=88602025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311040774.2A Pending CN117034949A (zh) 2023-08-17 2023-08-17 咨询工单的分类方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117034949A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118095794A (zh) * 2024-04-23 2024-05-28 国网辽宁省电力有限公司丹东供电公司 基于正则算法的工单信息提取方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118095794A (zh) * 2024-04-23 2024-05-28 国网辽宁省电力有限公司丹东供电公司 基于正则算法的工单信息提取方法及***

Similar Documents

Publication Publication Date Title
CN111767716B (zh) 企业多级行业信息的确定方法、装置及计算机设备
CN111339751A (zh) 一种文本关键词处理方法、装置及设备
CN109684627A (zh) 一种文本分类方法及装置
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN110276009B (zh) 一种联想词的推荐方法、装置、电子设备及存储介质
US20050138079A1 (en) Processing, browsing and classifying an electronic document
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
CN114722137A (zh) 基于敏感数据识别的安全策略配置方法、装置及电子设备
CN110597978A (zh) 物品摘要生成方法、***、电子设备及可读存储介质
CN111782793A (zh) 智能客服处理方法和***及设备
CN117034949A (zh) 咨询工单的分类方法、装置、电子设备及存储介质
CN111126073B (zh) 语义检索方法和装置
CN112988704A (zh) 一种基于ai咨询数据库集群搭建方法和***
AU2019290658B2 (en) Systems and methods for identifying and linking events in structured proceedings
CN112182150A (zh) 基于多元数据的聚合检索方法、装置、设备及存储介质
CN116719915A (zh) 智能问答方法、装置、设备及存储介质
CN114742062B (zh) 文本关键词提取处理方法及***
CN115221323A (zh) 基于意图识别模型的冷启动处理方法、装置、设备及介质
CN111949781B (zh) 一种基于自然语句句法分析的智能交互方法及装置
CN114491209A (zh) 基于互联网信息抓取的企业业务标签挖掘的方法和***
CN110276001B (zh) 盘点页识别方法、装置、计算设备和介质
CN113946668A (zh) 基于边缘节点的语义处理方法、***、装置及存储介质
CN111460206A (zh) 图像处理方法、装置、电子设备和计算机可读存储介质
CN110909538A (zh) 问答内容的识别方法、装置、终端设备及介质
CN117112809B (zh) 一种知识追踪方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination