CN117034952A - 语义理解方法、电子设备和存储介质 - Google Patents
语义理解方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117034952A CN117034952A CN202311157805.2A CN202311157805A CN117034952A CN 117034952 A CN117034952 A CN 117034952A CN 202311157805 A CN202311157805 A CN 202311157805A CN 117034952 A CN117034952 A CN 117034952A
- Authority
- CN
- China
- Prior art keywords
- clause
- domain
- model
- user input
- domains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000013145 classification model Methods 0.000 claims abstract description 30
- 238000004590 computer program Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 4
- 239000003550 marker Substances 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 abstract description 8
- 238000002372 labelling Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本发明公开语义理解方法、电子设备和存储介质,其中,一种语义理解方法,包括:将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。通过在领域分类模型上增加跨领域分类结果,从而实现了单领域多意图和跨领域多意图的语义解析,进一步地,基于领域预测结果使用分句模型进行切句,从而可以让语义理解更加准确。
Description
技术领域
本申请实施例涉及语音识别技术领域,特别是涉及一种语义理解方法、电子设备和存储介质。
背景技术
近几年,由于对话***的技术发展,越来越多的口语人机交互设备进入了广大人民群众的生活之中,比如家庭智能音箱、家庭智能电视,以及诸多的新能源汽车、地铁购票机等都开始大量搭载语音交互设备和功能。
在口语语义理解领域,一个句子单个意图的交互需求已经不能满足用户的需求。因此,支持一句话多意图的口语语义理解技术和方法成为了新的研究和应用热点。
现有技术中,一般使用序列标注模型对用户的输入语句进行槽位填充。其中,数据标签的设计针对多意图进行了适配和优化;每个令牌的标注格式会引入当前意图的信息,即表达了槽位和意图的归属关系。或者在槽位识别模型前先对每个词进行粗标签分类并将其利用进模型的训练输入数据中,以便于增加模型的泛化性,以此实现在跨领域的零样本槽填充。这些方法只能对训练过的多意图进行预测,例如训练数据中最多只有3个意图,则当输入句子的意图数量大于3时,预测精度会显著下降。而端到端的序列标注方式,随着意图数量的增加,数据的标签数量会呈倍数增加,在超多意图情景下,若不提高模型的参数量,模型预测精度会较低。
发明内容
本发明实施例提供了一种语义理解方法、电子设备和存储介质,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供了一种语义理解方法,包括:将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。
第二方面,本发明实施例提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明上述任一项语义理解方法。
第三方面,本发明实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项语义理解方法。
第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项语义理解方法。
本申请的方法通过构建了一种基于序列标注的抽取式分句模型的设计,从而可以实现多意图句子的切分,在分句任务上达到更高的准确率,同时在多意图迁移能力上也有更好的表现,进一步地,通过基于分句模型的方法实现对多意图句子的语义解析,同时在领域分类模型上增加跨领域分类结果,从而可以实现单领域多意图和跨领域多意图的语义解析,由于领域内槽位模型只需要对单意图句子进行解析,不需要额外的训练,引入分句模型后,即可无感支持多意图语义解析。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种语义理解方法的流程图;
图2为本发明一实施例提供的另一种语义理解方法的流程图;
图3为本发明一实施例提供的又一种语义理解方法的流程图;
图4为本发明一实施例提供的语义理解方法的一个具体示例的车载控制领域分句模型结构图;
图5为本发明一实施例提供的语义理解方法的一个具体示例的领域内句子的序列标注图;
图6为本发明一实施例提供的语义理解方法的一个具体示例的传统分类与跨领域分类的区别图;
图7为本发明一实施例提供的语义理解方法的一个具体示例的分句数据的标注格式图;
图8为本发明一实施例提供的语义理解方法的一个具体示例的位数据的标注格式图;
图9为本发明一实施例提供的语义理解方法的一个具体示例的语义理解流程图;
图10是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其示出了本发明一实施例提供的一种语义理解方法的流程图。
如图1所示,在步骤101中,将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;
在步骤102中,若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;
在步骤103中,若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。
在本实施例中,对于步骤101,语义理解装置将用户输入送入领域分类模型得到用户输入对应的领域预测结果,其中,领域分类模型用于预测句子所属的一个或多个领域,例如,用户输入的句子会被送入领域分类模型得到句子所属于领域的分类结果,领域分类模型的输出可以是单个领域,或多个领域的跨领域结果,以“打开车窗”这一单领域句子为例,领域分类模型给出的领域预测结果就是“车载控制”;若用户输入是“播放音乐然后打开空调”这一跨领域句子,领域分类模型给出的领域预测结果就是“音乐#车载控制,音乐#家居控制”。
然后,对于步骤102,若领域预测结果仅对应单个领域,使用对应于单个领域的分句模型对用户输入进行分句得到至少一个子句,其中,分句模型可以使用基于预训练模型Bert的序列标志模型,例如,当用户输入的句子被确定所属领域后,会被送入分句模型进行子句的切分,通过对分句模型输出标注提取出预设槽位名的槽位值,即获得所有该领域下可解析的子句,其中,在分句模型中,标签的类别包括对应领域子句的起始位置和其他位置和其他领域的子句的起始位置和其他位置,以“打开车窗然后空调调高二十度”是用户输入为例,将用户输入送入车载控制领域下的分句模型后得到分句数据标注“B-snt,I-snt,I-snt,I-snt,O,O,B-snt,I-snt,I-snt,I-snt,I-snt,I-snt,I-snt”,其中,B-snt为对应领域子句的起始位置,I-snt为对应领域子句的其他位置,能够得到车载领域下“打开车窗”和“空调调到二十度”两个子句。
最后,对于步骤103,若领域预测结果对应多个领域,分别使用对应于多个领域中每一个领域的分句模型对用户输入进行分句得到每一个领域中的至少一个子句,例如,若领域预测结果为跨领域结果,输入的句子会同时送入该跨领域组合的所有领域下的分句模型进行子句的切分,通过对分句模型输出标注提取出预设槽位名的槽位值,即获得所有该领域下可解析的子句,以“导航到XXXX然后打开车窗”是用户输入为例,将用户输入送入车载控制领域下的分句模型后得到分句数据标注“B-cross,I-cross,I-cross,I-cross,I-cross,I-cross,I-cross,O,O,B-snt,I-snt,I-snt,I-snt”,其中,B-cross为其他领域的子句的起始位置,I-cross为其他领域的其他位置,能够得到车载领域下“打开车窗”这一子句;音域领域下的分句模型后得到分句数据标注“B-snt,I-snt,I-snt,I-snt,I-snt,I-snt,I-snt,O,O,B-cross,I-cross,I-cross,I-cross”,能够得到音乐领域下“导航到XXXX”这一子句。
本实施例的方法通过在领域分类模型上增加跨领域分类结果,从而实现了单领域多意图和跨领域多意图的语义解析,进一步地,基于领域预测结果使用分句模型进行切句,从而可以让语义理解更加准确。
进一步请参考图2,其示出了本发明一实施例提供的另一种语义理解方法,该流程图主要是对流程图1“若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句”之后的流程进一步限定的步骤的流程图。
如图2所示,在步骤201中,对于每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图;
在步骤202中,对所述各子句的槽位和意图进行合并得到所述用户输入的语义输出。
在本实施例中,对于步骤201,语义理解装置对于每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图,在一具体实施例中,单意图槽位模型是基于序列标注的方法,槽位数据的标注只需要按照常用的BIO格式即可,以“帮我打开车窗”为例,与之对应的输出标签就是“O,O,B-操作,I-操作,B-对象,I-对象”,意图为车载控制。
然后,对于步骤202,语义理解装置对各子句的槽位和意图进行合并得到用户输入的语义输出,例如,通过子句顺序,对多个子句的槽位解析和意图监测结果进行排序与合并,从而可以获得单领域下对当前用户输入的槽位解析结果。
本实施例的方法通过对于每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图,然后对各子句的槽位和意图进行合并得到用户输入的语义输出,从而可以实现让多意图句子的语义理解更加准确。
进一步请参考图3,其示出了本发明一实施例提供的又一种语义理解方法,该流程图主要是对流程图1“若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句”之后的流程进一步限定的步骤的流程图。
如图3所示,在步骤301中,对于当前领域下每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图;
在步骤302中,对于所述当前领域下所述各子句的槽位和意图进行合并得到当前领域语义输出;
在步骤303中,将多个领域对应的多个当前领域语义输出进行融合得到所述用户输入的语义输出。
在本实施例中,对于步骤301,语义理解装置对于当前领域下每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图,例如,单意图槽位模型依次对所有输入的子句进行解析并获得子句即单个意图的槽位。
然后,对于步骤302,语义理解装置对于当前领域下所述各子句的槽位和意图进行合并得到当前领域语义输出,例如,通过子句顺序,对多个子句的槽位解析和意图监测结果进行排序与合并,到此可以获得单领域下对当前用户输入的槽位解析结果。
最后,对于步骤303,语义理解装置将多个领域对应的多个当前领域语义输出进行融合得到用户输入的语义输出,例如,在获得了单领域的槽位解析结果后,需要对总体结果进行融合,若分类模型的结果为跨领域,则输出该跨领域组合下所有领域的槽位解析结果,若分类模型结果为单个领域,则直接输出该领域下的槽位解析结果。
在一些可选的实施例中,所述使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句,其中,所述分句模型是基于预训练模型Bert的序列标志模型,所述方法包括:
语义理解装置基于Bert编码器获取用户输入的词向量并对每个词向量进行多标签分类,从而可以实现在分句任务上达到更高的准确率,同时在多意图迁移能力上也有更好的表现。
在一些可选的实施例中,所述多标签的类别包括对应领域下子句的起始位置和其他位置,以及其他领域下子句的起始位置和其他位置。
在一些可选的实施例中,所述使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句,所述方法包括:
将所述对应领域下子句的起始位置和其他位置送入所述对应领域下的单意图槽位模型。
在一些可选的实施例中,所述分句模型还使用生成式的序列到序列模型来完成分句任务,从而可以在分句时,对子句内容进行补充,提高子句信息的丰富度。
在一些可选的实施例中,所述单意图槽位模型是基于序列标注的方法进行训练,其中,槽位数据的标注为BIO格式,例如,通常对于句子的语义理解可以视作为序列标注或命名实体识别任务,在任务型对话中,往往需要对句子的每个具有意义的槽位进行归一化操作,以便于后续对话的处理;对于已经在特定领域中的句子,能够直接在原句中映射的称之为对齐槽位,而对于整句话进行推理判断的槽位,称之为非对齐槽位。由于非对齐槽位中也包含这句话的意图,故也有人称为意图槽,在一具体实施例中,使用常用的BIO-tag方法对对齐语义槽进行序列标注,而非对齐槽位会直接输出。
本实施例的方法通过基于序列标注的方法进行训练单意图槽位模型,从而可以让语义理解更加准确。
请参考图4,其示出了本发明一实施例提供的语义理解方法的一个具体示例的车载控制领域分句模型结构图。
如图所示,分句模型采用了基于预训练模型Bert的序列标志模型,多意图句子首先会通过Bert编码器获得词向量然后对每个token进行多标签分类,其中,token指的是通过分词方式获得的每个独立的词,例如“我爱祖国”会被分为”我/爱/祖国”,token经过神经网络会变成词向量,词向量是token的衍生物。在分句模型中,标签的类别为“B-snt”,“I-snt”,“B-cross”,“I-cross”。其中“B-snt”和“I-snt”分别代表了该领域下子句的起始位置和其他位置。而“B-cross”和“I-cross”代表了其他领域的子句的起始位置和其他位置。在实际应用场景中,槽位名为“snt”的子句会被送入该领域下的单意图槽位解析模型。
槽位解析模型是基于序列标注任务的,其结构与图4相似但数据的标注格式有所不同,由于分句模型已经将多意图句子切分为了单意图的子句,槽位解析模型只需要在单意图数据集上训练即可。
请参考图5,其示出了本发明一实施例提供的语义理解方法的一个具体示例的领域内句子的序列标注图。
如图5所示,通常对于句子的语义理解可以视作为序列标注或命名实体识别任务,在任务型对话中,往往需要对句子的每个具有意义的槽位进行归一化操作,以便于后续对话的处理;对于已经在特定领域中的句子,能够直接在原句中映射的称之为对齐槽位,而对于整句话进行推理判断的槽位,称之为非对齐槽位;由于非对齐槽位中也包含这句话的意图,故也有人称为意图槽;采用常用的BIO-tag方法对对齐语义槽进行序列标注,而非对齐槽位会直接输出。
请参考图6,其示出了本发明一实施例提供的语义理解方法的一个具体示例的传统分类与跨领域分类的区别图。
如图6所示,对于跨领域一句话多意图的句子,需要同时输出其命中的各个领域的语义解析结果同时包含各个领域内的意图结果;对于跨领域多意图的句子,可以定义为:一句话由两个不同的特定领域的子句组合拼接而成。例如“播放我喜欢的的歌然后帮我导航回家”就是由音乐领域内的子句“播放我喜欢的的歌”和地图领域内的子句“帮我导航回家”组合而成;对于这种类型的句子,以往不能识别跨领域情况的领域分类模型会将其直接判断为”地图“或“音乐”而不是“地图”和“音乐”同时存在。而具有跨领域分类能力的分类模型会将其分类为同时存在的两个领域并且这两个领域的槽位解析模型的结果同时输出。不具备跨领域分类能力的分类模型只能对输入的句子进行一个领域的解析结果,即使有多个领域的分类结果,也是呈现为并列关系。而实际需要得到的解析输出需要同时具备两个领域的解析结果,例如“导航到世界之窗然后打开空调”的跨领域分类结果为“地图#车载控制”,“地图#家居控制”。
请参考图7,其示出了本发明一实施例提供的语义理解方法的一个具体示例的分句数据的标注格式图。
如图7所示,基于序列标注的方式构建分句数据,分句数据是通过单意图的完整句子生成所得。与常规序列标注将一个词作为槽位不同的是,我们的分句数据将一个子句作为一个槽位名为snt的槽,分句时将该槽位的值提取出即可得到所有的子句。同时,为了支持跨领域多意图的解析,领域外的句子会标记为cross槽。
请参考图8,其示出了本发明一实施例提供的语义理解方法的一个具体示例的位数据的标注格式图。
如图8所示,槽位解析模型是基于序列标注方法进行训练的,槽位数据的标注只需要按照常用的BIO格式即可,
请参考图9,其示出了本发明一实施例提供的语义理解方法的一个具体示例的语义理解流程图。
如图9所示,步骤1:对输入的句子分类。
首先,用户输入的句子会被送入领域分类模型得到句子所属于领域的分类结果。分类模型的输出可以是单个领域,或多个领域的跨领域结果。若分类结果为单个领域,输入的句子会直接被送入对应领域下的分句模型和槽位解析模型。若分类结果为跨领域结果,输入的句子会同时送入该跨领域组合的所有领域下的分句模型和槽位解析模型。
步骤2:切分子句。
当句子被确定所属领域后,会被送入分句模型进行子句的切分。通过对分句模型输出标注提取出槽位名为snt的槽位值,即获得所有该领域下可解析的子句。这些子句接下来会被依次送入槽位解析模型进行槽位解析和意图检测。若只切分出一句子句,即输入为单意图,则将整句输入槽位解析模型。
步骤3:解析子句槽位。
槽位解析模型依次对所有输入的子句进行解析并获得子句即单个意图的槽位。
步骤4:子句槽位合并。
通过子句顺序,对多个子句的槽位解析和意图监测结果进行排序与合并。到此可以获得单领域下对当前用户输入的槽位解析结果。
步骤5:语义融合。
当我们获得了单领域的槽位解析结果后,需要对总体结果进行融合。若分类模型的结果为跨领域,则输出该跨领域组合下所有领域的槽位解析结果。若分类模型结果为单个领域,则直接输出该领域下的槽位解析结果。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的语义理解方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;
若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;
若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据语义理解装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至语义理解装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项语义理解方法。
图10是本发明实施例提供的电子设备的结构示意图,如图10所示,该设备包括:一个或多个处理器1010以及存储器1020,图10中以一个处理器1010为例。语义理解方法的设备还可以包括:输入装置1030和输出装置1040。处理器1010、存储器1020、输入装置1030和输出装置1040可以通过总线或者其他方式连接,图10中以通过总线连接为例。存储器1020为上述的非易失性计算机可读存储介质。处理器1010通过运行存储在存储器1020中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例语义理解方法。输入装置1030可接收输入的数字或字符信息,以及产生与语义理解装置的用户设置以及功能控制有关的键信号输入。输出装置1040可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于语义理解装置中,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;
若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;
若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语义理解方法,包括:
将用户输入送入领域分类模型得到所述用户输入对应的领域预测结果,其中,所述领域分类模型用于预测句子所属的一个或多个领域;
若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句;
若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句。
2.权利要求1所述的方法,其中,在若所述领域预测结果仅对应单个领域,使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句之后,所述方法还包括:
对于每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图;
对所述各子句的槽位和意图进行合并得到所述用户输入的语义输出。
3.权利要求1所述的方法,其中,在若所述领域预测结果对应多个领域,分别使用对应于所述多个领域中每一个领域的分句模型对所述用户输入进行分句得到每一个领域中的至少一个子句之后,所述方法还包括:
对于当前领域下每一个子句,分别使用单意图槽位模型进行解析得到对应于各子句的槽位和意图;
对于所述当前领域下所述各子句的槽位和意图进行合并得到当前领域语义输出;
将多个领域对应的多个当前领域语义输出进行融合得到所述用户输入的语义输出。
4.根据权利要求1所述的方法,其中,所述使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句,其中,所述分句模型是基于预训练模型Bert的序列标志模型,所述方法包括:
基于Bert编码器获取所述用户输入的词向量并对每个词向量进行多标签分类。
5.根据权利要求4所述的方法,其中,所述多标签的类别包括对应领域下子句的起始位置和其他位置,以及其他领域下子句的起始位置和其他位置。
6.根据权利要求5所述的方法,其中,所述使用对应于所述单个领域的分句模型对所述用户输入进行分句得到至少一个子句,所述方法包括:
将所述对应领域下子句的起始位置和其他位置送入所述对应领域下的单意图槽位模型。
7.根据权利要求4所述的方法,其中,所述分句模型还使用生成式的序列到序列模型来完成分句任务。
8.根据权利要求1所述的方法,其中,所述单意图槽位模型是基于序列标注的方法进行训练,其中,槽位数据的标注为BIO格式。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311157805.2A CN117034952A (zh) | 2023-09-08 | 2023-09-08 | 语义理解方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311157805.2A CN117034952A (zh) | 2023-09-08 | 2023-09-08 | 语义理解方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117034952A true CN117034952A (zh) | 2023-11-10 |
Family
ID=88622912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311157805.2A Pending CN117034952A (zh) | 2023-09-08 | 2023-09-08 | 语义理解方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117034952A (zh) |
-
2023
- 2023-09-08 CN CN202311157805.2A patent/CN117034952A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112100349B (zh) | 一种多轮对话方法、装置、电子设备及存储介质 | |
CN108509619B (zh) | 一种语音交互方法及设备 | |
CN110516253B (zh) | 中文口语语义理解方法及*** | |
CN111081280B (zh) | 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法 | |
CN111292751B (zh) | 语义解析方法及装置、语音交互方法及装置、电子设备 | |
CN112786029B (zh) | 使用弱监督数据训练vad的方法及装置 | |
CN111159358A (zh) | 多意图识别训练和使用方法及装置 | |
CN115525753A (zh) | 面向任务的基于1+n的多轮对话方法及*** | |
CN115064167A (zh) | 语音交互方法、服务器和存储介质 | |
CN111739520A (zh) | 一种语音识别模型训练方法、语音识别方法、装置 | |
CN111737990B (zh) | 一种词槽填充方法、装置、设备及存储介质 | |
CN111274823B (zh) | 一种文本语义理解的方法和相关装置 | |
CN117407507A (zh) | 基于大语言模型的事件处理方法、装置、设备及介质 | |
CN111680514B (zh) | 信息处理和模型训练方法、装置、设备及存储介质 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
CN116578665A (zh) | 基于提示学习的可扩展文本信息联合抽取方法及设备 | |
CN117034952A (zh) | 语义理解方法、电子设备和存储介质 | |
CN112632962B (zh) | 人机交互***中实现自然语言理解方法和装置 | |
CN113571063B (zh) | 语音信号的识别方法、装置、电子设备及存储介质 | |
CN114896988A (zh) | 统一的对话理解方法及框架 | |
CN114490993A (zh) | 小样本意图识别方法、***、设备及存储介质 | |
CN114036268A (zh) | 基于意图门的任务型多轮对话方法及*** | |
CN116956941B (zh) | 一种文本识别方法、装置、设备及介质 | |
CN116702785B (zh) | 关系标签的处理方法和装置、存储介质及电子设备 | |
CN115640814A (zh) | 语义理解模型训练方法、使用方法、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |