CN111400340A - 一种自然语言处理方法、装置、计算机设备和存储介质 - Google Patents
一种自然语言处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111400340A CN111400340A CN202010170324.5A CN202010170324A CN111400340A CN 111400340 A CN111400340 A CN 111400340A CN 202010170324 A CN202010170324 A CN 202010170324A CN 111400340 A CN111400340 A CN 111400340A
- Authority
- CN
- China
- Prior art keywords
- natural language
- user
- matching
- information
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000003058 natural language processing Methods 0.000 title claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 9
- 230000011218 segmentation Effects 0.000 abstract description 9
- 230000002349 favourable effect Effects 0.000 abstract description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明适用于人工智能技术领域,提供了一种自然语言处理方法、装置、计算机设备和存储介质,其中,所述自然语言处理方法包括:获取用户输入的自然语言信息;对所述自然语言信息进行识别并确定用户意图信息;对所述用户意图信息进行关键词提取;在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。一方面,减少了传统分词技术对语言处理的干扰,大大提高了自然语言理解的精确率,另一方面,采用独特的镶嵌技术,博采众长,在人机交互结果上更加友好人性,有利于更好的服务客户。
Description
技术领域
本发明属于人工智能技术领域,尤其涉及一种自然语言处理方法、装置、计算机设备和存储介质。
背景技术
人机交互是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。
近年来,人机交互在各个领域已取得了一定进展,正在逐步替代图形用户界面而成为新的用户界面。但是,由于所采用的技术的局限,当前的人机交互在针对自然语言的处理时,更多采用单一的模型进行处理,涉及行业较为单一,对不同行业数据表现结果一般,而且针对汉语言,往往需要借助分词技术,对模型的表现力有很大影响,且仅能够进行简单地对话和处理简单的问题,在某些情况下不能有效的理解客户意图,遇到无法回答的问题或无法理解的表述时,一般只会简单地调用搜索引擎对用户输入中的关键词进行搜索,并直接将搜索结果的网页返回给用户,不利于更好的服务客户。
由此可见,现有的自然语言处理方法涉及行业较为单一,对不同行业数据表现结果一般,而且往往需要借助分词技术,对模型的表现力有很大影响,不利于更好的服务客户。
发明内容
本发明实施例的目的在于提供一种自然语言处理方法,旨在解决现有的自然语言处理方法涉及行业较为单一,对不同行业数据表现结果一般,而且往往需要借助分词技术,对模型的表现力有很大影响,不利于更好的服务客户的问题。
本发明实施例是这样实现的,一种自然语言处理方法,包括:
获取用户输入的自然语言信息;
对所述自然语言信息进行识别并确定用户意图信息;
对所述用户意图信息进行关键词提取;
在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
本发明实施例的另一目的在于一种自然语言处理装置,包括:
获取单元,用于获取用户的自然语言信息;
意图确定单元,用于对所述自然语言信息进行识别并确定用户意图信息;
关键词提取单元,用于对所述用户意图信息进行关键词提取;以及
输出单元,用于在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
本发明实施例的另一目的在于一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述自然语言处理方法的步骤。
本发明实施例的另一目的在于一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述自然语言处理方法的步骤。
本发明实施例提供的自然语言处理方法,通过对用户输入的自然语言信息进行识别并确定用户意图信息;进而在知识库中确定与所述用户意图信息的关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出;一方面,减少了传统分词技术对语言处理的干扰,大大提高了自然语言理解的精确率,另一方面,采用独特的镶嵌技术,博采众长,在人机交互结果上更加友好人性化,有利于更好的服务客户。
附图说明
图1为本发明实施例一提供的自然语言处理方法的实现流程图;
图2为本发明实施例二提供的自然语言处理方法的实现流程图;
图3为本发明实施例三提供的自然语言处理方法的实现流程图;
图4为本发明实施例四提供的自然语言处理方法的实现流程图;
图5为本发明实施例五提供的自然语言处理方法的实现流程图;
图6为本发明实施例六提供的自然语言处理方法的实现流程图;
图7为本发明实施例七提供的自然语言处理方法的实现流程图;
图8为本发明实施例九提供的自然语言处理装置的结构框图;
图9为一个实施例中计算机设备的内部结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。
本发明实施例提供的自然语言处理方法,通过对用户输入的自然语言信息进行识别并确定用户意图信息;进而在知识库中确定与所述用户意图信息的关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出;一方面,减少了传统分词技术对语言处理的干扰,大大提高了自然语言理解的精确率,另一方面,采用独特的镶嵌技术,博采众长,在人机交互结果上更加友好人性,有利于更好的服务客户。
为了进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如下。
图1示出了本发明实施例一提供的自然语言处理方法的实现流程,为了便于说明,仅示出与本发明实施例相关的部分,详述如下:
在步骤S101中,获取用户输入的自然语言信息。
在本发明实施例中,所述获取用户输入的自然语言信息可以是用户直接输入的文本格式的自然语言信息,例如用户在使用商城指引板板搜索相关店铺的位置信息时,能够对用户输入的文本信息进行分析;也可以是利用语音识别模型识别用户输入的语音格式的自然语言信息,并处理为文本格式的自然语言信息,例如在用户在使用电话进行咨询时,能够对用户的语音信息进行分析。
在步骤S102中,对所述自然语言信息进行识别并确定用户意图信息。
在本发明实施例中,用户意图信息可以通过预设的意图识别模型,由于现有的意图识别模型种类较多,本发明对具体的意图识别模型不做要求,本领域技术人员可以根据实际需求选用合适的意图识别模型,例如可以是基于语义分析树构造的路径特征对意图的识别模型,也可以是基于注意力机制的卷积神经网络的意图识别模型。
在本发明实施例中,对所述自然语言信息进行识别并确定用户意图信息,可以为对自然语言信息进行文本识别后,确定该信息所属专业行业领域,进而结合所确定的专业行业领域的用户意图识别模型识别出用户意图信息。
在步骤S103中,对所述用户意图信息进行关键词提取。
在本发明实施例中,
在步骤S104中,在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
在本发明实施例中,
本发明实施例提供的自然语言处理方法,通过对用户输入的自然语言信息进行识别并确定用户意图信息;进而在知识库中确定与所述用户意图信息的关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出;一方面,减少了传统分词技术对语言处理的干扰,大大提高了自然语言理解的精确率,另一方面,采用独特的镶嵌技术,博采众长,在人机交互结果上更加友好人性,有利于更好的服务客户。
图2示出了本发明实施例二提供的自然语言处理方法的实现流程,为了便于说明,仅示出与本发明实施例相关的部分,其与实施例一类似,不同之处在于,所述步骤102,具体包括:
在步骤S201中,对所述自然语言信息进行识别并生成语义表示。
在本发明实施例中,对所述自然语言信息进行识别并生成语义表示的一种实现方式可以是,对自然语言信息进行预处理,将其转换为结构化查询语言(SQL语句),以供识别出其所述行业以及其需求信息。
在步骤S202中,根据所述语义表示确定文本分类。
在本发明实施例中,根据所述语义表示确定文本分类的一种实现方式可以是,根据所转换的结构化查询语言,确定该自然语言信息所属专业行业领域。
在步骤S203中,根据所述语义表示以及文本分类,确定用户意图信息。
本发明实施例提供的自然语言处理方法,通过先对自然语言信息进行识别并生成语义表示,进而对语义表示进行专业领域识别处理,在获取到所述自然语言信息所属专业领域后,能够及时定位到相应的与所述专业领域对应的意图识别模型中进行处理,有效地提高了用户意图识别的准确率。
图3示出了本发明实施例三提供的自然语言处理方法的实现流程,为了便于说明,仅示出与本发明实施例相关的部分,其与实施例二类似,不同之处在于,所述步骤S203,包括以下步骤:
在步骤S301中,基于所述文本分类,将所述语义表示转换为语义向量。
在本发明实施例中,基于所述文本分类,将所述语义表示转换为语义向量的实现方式可以为,通过及时定位到相应的专业技术领域中,将各个时间序列下的语义表示转换为对应时间状态下的词向量,通过长短时记忆网络(LSTM)对所得词向量进行建模,使用最后一个时间状态向量作为整个句子的表示,即句子向量。在实际应用中,由于每一个时刻对应用户输入的一句话,切词之后就是一个词序列,而LSTM可以提取时间序列的特征,对每一句话通过LSTM获取最后一个状态向量作为整个句子的编码。
在本发明实施例中,把用户的文字输入转换为向量输入,通常采用用户聊天日志进行word2vec(词向量)训练,之后用户输入通过Embedding layer(嵌入层)进行转换,即通过一个embedding layer将用户输入(切词之后的输入)每一个词转换为一个向量,这是业界通用的处理方式,在此不再赘述。
在步骤S302中,根据所述语义向量以及预设训练模型,确定用户意图的概率分布信息,并输出。
在本发明实施例中,预设训练模型可以为神经网络,神经网络是一个概念,一类算法的总称,可以使用常见的rnn(循环神经网络)、cnn(卷积神经网络)和全连接网络。
在步骤S303中,将概率分布阈值最大的用户意图确定为用户意图信息。
图4示出了本发明实施例四提供的自然语言处理方法的实现流程,为了便于说明,仅示出与本发明实施例相关的部分,其与实施例一类似,不同之处在于,所述步骤S104,具体包括以下步骤:
在步骤S401中,判断知识库中的标签与所述关键词的匹配度是否超过预设匹配阈值;若是,则进入步骤S402中;若否,则进入步骤S403中。
在步骤S402中,获取与所述关键词精确匹配的标签对应的匹配答案,并向用户输出。
在步骤S403中,获取与所述关键词模糊匹配的至少一个标签对应的匹配答案,对所述匹配答案进行计算处理,并将处理后的匹配答案向用户输出。
图5示出了本发明实施例五提供的自然语言处理方法的实现流程,为了便于说明,仅示出与本发明实施例相关的部分,其与实施例一类似,不同之处在于,所述步骤S104,具体包括以下步骤:
在步骤S501中,对所述关键词进行分析处理,获取与所述关键词词义相同的关联词。
在步骤S502中,在知识库中确定与所述关联词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
图6示出了本发明实施例六提供的自然语言处理方法的实现流程,为了便于说明,仅示出与本发明实施例相关的部分,其与实施例一类似,不同之处在于,还包括以下步骤:
在步骤S601中,当判断用户对所述匹配答案不满意时,则输出手动添加提醒,并将接收的正确的匹配答案作为训练集。
在步骤S602中,当判断用户对所述匹配答案满意时,则将所述匹配答案作为验证集。
在步骤S603中,根据所述训练集以及验证集,按照预设的优化周期对所述预设训练模型进行优化处理。
图7示出了本发明实施例七提供的自然语言处理方法的实现流程,为了便于说明,仅示出与本发明实施例相关的部分,其与实施例一类似,不同之处在于,还包括以下步骤:
在步骤S701中,根据所述训练集以及验证集,对所述知识库及其标签进行更新处理。
在本发明实施例中,通过将错误的匹配答案进行调整,作为训练集,将正确答案延续作为验证集,对知识库及其标签进行更新处理,能够反向对知识库进行优化,进一步提高匹配结果的准确性以及稳定性。
图8示出了本发明实施例八提供的自然语言处理装置800的结构,为了便于说明,仅示出与本发明实施例相关的部分,详述如下:
该自然语言处理装置800,包括获取单元801、意图确定单元802、关键词提取单元803以及输出单元804。
获取单元801,用于获取用户的自然语言信息。
在本发明实施例中,所述获取用户输入的自然语言信息可以是用户直接输入的文本格式的自然语言信息,例如用户在使用商城指引板板搜索相关店铺的位置信息时,能够对用户输入的文本信息进行分析;也可以是利用语音识别模型识别用户输入的语音格式的自然语言信息,并处理为文本格式的自然语言信息,例如在用户在使用电话进行咨询时,能够对用户的语音信息进行分析。
意图确定单元802,用于对所述自然语言信息进行识别并确定用户意图信息。
在本发明实施例中,用户意图信息可以通过预设的意图识别模型,由于现有的意图识别模型种类较多,本发明对具体的意图识别模型不做要求,本领域技术人员可以根据实际需求选用合适的意图识别模型,例如可以是基于语义分析树构造的路径特征对意图的识别模型,也可以是基于注意力机制的卷积神经网络的意图识别模型。
在本发明实施例中,对所述自然语言信息进行识别并确定用户意图信息,可以为对自然语言信息进行文本识别后,确定该信息所属专业行业领域,进而结合所确定的专业行业领域的用户意图识别模型识别出用户意图信息。
关键词提取单元803,用于对所述用户意图信息进行关键词提取。
输出单元804,用于在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
本发明实施例提供的自然语言处理装置,通过对用户输入的自然语言信息进行识别并确定用户意图信息;进而在知识库中确定与所述用户意图信息的关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出;一方面,减少了传统分词技术对语言处理的干扰,大大提高了自然语言理解的精确率,另一方面,采用独特的镶嵌技术,博采众长,在人机交互结果上更加友好人性,有利于更好的服务客户。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端(或服务器)。如图9所示,该计算机设备包括该计算机设备包括通过***总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作***,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现自然语言处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行自然语言处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的自然语言处理装置可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成该自然语言处理装置的各个程序模块,比如,图8所示的获取单元801、意图确定单元802、关键词提取单元803以及输出单元804。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的自然语言处理方法中的步骤。
例如,图9所示的计算机设备可以通过如图8所示的自然语言处理装置中的获取单元801执行步骤S101。计算机设备可通过意图确定单元802执行步骤S102。计算机设备可通过关键词提取单元803执行步骤S103。计算机设备可通过输出单元804执行步骤S104。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用户输入的自然语言信息;
对所述自然语言信息进行识别并确定用户意图信息;
对所述用户意图信息进行关键词提取;
在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取用户输入的自然语言信息;
对所述自然语言信息进行识别并确定用户意图信息;
对所述用户意图信息进行关键词提取;
在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种自然语言处理方法,其特征在于,包括:
获取用户输入的自然语言信息;
对所述自然语言信息进行识别并确定用户意图信息;
对所述用户意图信息进行关键词提取;
在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
2.根据权利要求1所述的自然语言处理方法,其特征在于,所述对所述自然语言信息进行识别并确定用户意图信息的步骤,具体包括:
对所述自然语言信息进行识别并生成语义表示;
根据所述语义表示确定文本分类;
根据所述语义表示以及文本分类,确定用户意图信息。
3.根据权利要求2所述的自然语言处理方法,其特征在于,所述根据所述语义表示以及文本分类,确定用户意图信息的步骤,具体包括:
基于所述文本分类,将所述语义表示转换为语义向量;
根据所述语义向量以及预设训练模型,确定用户意图的概率分布信息,并输出;
将概率分布阈值最大的用户意图确定为用户意图信息。
4.根据权利要求1所述的自然语言处理方法,其特征在于,所述在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出的步骤,具体包括:
判断知识库中的标签与所述关键词的匹配度是否超过预设匹配阈值;
当知识库中的标签与所述关键词的匹配度超过预设匹配阈值时,则获取与所述关键词精确匹配的标签对应的匹配答案,并向用户输出;
当知识库中的标签与所述关键词的匹配度没有超过预设匹配阈值时,则获取与所述关键词模糊匹配的至少一个标签对应的匹配答案,对所述匹配答案进行计算处理,并将处理后的匹配答案向用户输出。
5.根据权利要求1所述的自然语言处理方法,其特征在于,所述在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出的步骤,具体包括:
对所述关键词进行分析处理,获取与所述关键词词义相同的关联词;
在知识库中确定与所述关联词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
6.根据权利要求1所述的自然语言处理方法,其特征在于,还包括:
当判断用户对所述匹配答案不满意时,则输出手动添加提醒,并将接收的正确的匹配答案作为训练集;
当判断用户对所述匹配答案满意时,则将所述匹配答案作为验证集;
根据所述训练集以及验证集,按照预设的优化周期对所述预设训练模型进行优化处理。
7.根据权利要求6所述的自然语言处理方法,其特征在于,还包括:
根据所述训练集以及验证集,对所述知识库及其标签进行更新处理。
8.一种自然语言处理装置,其特征在于,包括:
获取单元,用于获取用户的自然语言信息;
意图确定单元,用于对所述自然语言信息进行识别并确定用户意图信息;
关键词提取单元,用于对所述用户意图信息进行关键词提取;以及
输出单元,用于在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至7中任一项权利要求所述自然语言处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至7中任一项权利要求所述自然语言处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010170324.5A CN111400340B (zh) | 2020-03-12 | 2020-03-12 | 一种自然语言处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010170324.5A CN111400340B (zh) | 2020-03-12 | 2020-03-12 | 一种自然语言处理方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111400340A true CN111400340A (zh) | 2020-07-10 |
CN111400340B CN111400340B (zh) | 2024-01-09 |
Family
ID=71436224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010170324.5A Active CN111400340B (zh) | 2020-03-12 | 2020-03-12 | 一种自然语言处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111400340B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182058A (zh) * | 2020-08-17 | 2021-01-05 | 北京来也网络科技有限公司 | 结合rpa和ai的内容获取方法、装置、计算机设备及介质 |
CN112527965A (zh) * | 2020-12-18 | 2021-03-19 | 国家电网有限公司客户服务中心 | 基于专业库和闲聊库相结合的自动问答实现方法和装置 |
CN113450075A (zh) * | 2021-07-05 | 2021-09-28 | 中国工商银行股份有限公司 | 基于自然语言技术的工单处理方法及装置 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951458A (zh) * | 2014-03-26 | 2015-09-30 | 华为技术有限公司 | 基于语义识别的帮助处理方法及设备 |
WO2018000279A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 基于导流的意图识别方法和*** |
US20180121810A1 (en) * | 2016-10-31 | 2018-05-03 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for analyzing intention based on artificial intelligence |
CN108304444A (zh) * | 2017-11-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 信息查询方法及装置 |
CN109241259A (zh) * | 2018-08-24 | 2019-01-18 | 国网江苏省电力有限公司苏州供电分公司 | 基于er模型的自然语言查询方法、装置及*** |
CN109543030A (zh) * | 2018-10-12 | 2019-03-29 | 平安科技(深圳)有限公司 | 客服机器人会话文本分类方法及装置、设备、存储介质 |
WO2019085697A1 (zh) * | 2017-10-31 | 2019-05-09 | 科沃斯商用机器人有限公司 | 人机交互方法和*** |
WO2019085236A1 (zh) * | 2017-10-31 | 2019-05-09 | 北京小度信息科技有限公司 | 检索意图识别方法、装置、电子设备及可读存储介质 |
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及*** |
US20190278846A1 (en) * | 2017-03-02 | 2019-09-12 | Tencent Technology (Shenzhen) Company Limited | Semantic extraction method and apparatus for natural language, and computer storage medium |
CN110266899A (zh) * | 2019-06-11 | 2019-09-20 | 平安科技(深圳)有限公司 | 客户意图的识别方法和客服*** |
CN110334344A (zh) * | 2019-06-13 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 一种语义意图识别方法、装置、设备及存储介质 |
CN110472035A (zh) * | 2019-08-26 | 2019-11-19 | 杭州城市大数据运营有限公司 | 一种智能应答方法、装置、计算机设备及存储介质 |
CN110674639A (zh) * | 2019-09-24 | 2020-01-10 | 拾音智能科技有限公司 | 一种基于预训练模型的自然语言理解方法 |
US20200065384A1 (en) * | 2018-08-26 | 2020-02-27 | CloudMinds Technology, Inc. | Method and System for Intent Classification |
-
2020
- 2020-03-12 CN CN202010170324.5A patent/CN111400340B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951458A (zh) * | 2014-03-26 | 2015-09-30 | 华为技术有限公司 | 基于语义识别的帮助处理方法及设备 |
WO2018000279A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 基于导流的意图识别方法和*** |
US20180121810A1 (en) * | 2016-10-31 | 2018-05-03 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for analyzing intention based on artificial intelligence |
US20190278846A1 (en) * | 2017-03-02 | 2019-09-12 | Tencent Technology (Shenzhen) Company Limited | Semantic extraction method and apparatus for natural language, and computer storage medium |
WO2019085697A1 (zh) * | 2017-10-31 | 2019-05-09 | 科沃斯商用机器人有限公司 | 人机交互方法和*** |
WO2019085236A1 (zh) * | 2017-10-31 | 2019-05-09 | 北京小度信息科技有限公司 | 检索意图识别方法、装置、电子设备及可读存储介质 |
CN108304444A (zh) * | 2017-11-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 信息查询方法及装置 |
CN109241259A (zh) * | 2018-08-24 | 2019-01-18 | 国网江苏省电力有限公司苏州供电分公司 | 基于er模型的自然语言查询方法、装置及*** |
US20200065384A1 (en) * | 2018-08-26 | 2020-02-27 | CloudMinds Technology, Inc. | Method and System for Intent Classification |
CN109543030A (zh) * | 2018-10-12 | 2019-03-29 | 平安科技(深圳)有限公司 | 客服机器人会话文本分类方法及装置、设备、存储介质 |
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及*** |
CN110266899A (zh) * | 2019-06-11 | 2019-09-20 | 平安科技(深圳)有限公司 | 客户意图的识别方法和客服*** |
CN110334344A (zh) * | 2019-06-13 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 一种语义意图识别方法、装置、设备及存储介质 |
CN110472035A (zh) * | 2019-08-26 | 2019-11-19 | 杭州城市大数据运营有限公司 | 一种智能应答方法、装置、计算机设备及存储介质 |
CN110674639A (zh) * | 2019-09-24 | 2020-01-10 | 拾音智能科技有限公司 | 一种基于预训练模型的自然语言理解方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182058A (zh) * | 2020-08-17 | 2021-01-05 | 北京来也网络科技有限公司 | 结合rpa和ai的内容获取方法、装置、计算机设备及介质 |
CN112182058B (zh) * | 2020-08-17 | 2024-04-09 | 北京来也网络科技有限公司 | 结合rpa和ai的内容获取方法、装置、计算机设备及介质 |
CN112527965A (zh) * | 2020-12-18 | 2021-03-19 | 国家电网有限公司客户服务中心 | 基于专业库和闲聊库相结合的自动问答实现方法和装置 |
CN113450075A (zh) * | 2021-07-05 | 2021-09-28 | 中国工商银行股份有限公司 | 基于自然语言技术的工单处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111400340B (zh) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765265B (zh) | 信息分类抽取方法、装置、计算机设备和存储介质 | |
CN110096570B (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
CN108427707B (zh) | 人机问答方法、装置、计算机设备和存储介质 | |
CN109992664B (zh) | 争议焦点的标注分类方法、装置、计算机设备和存储介质 | |
CN110909137A (zh) | 基于人机交互的信息推送方法、装置和计算机设备 | |
CN109522393A (zh) | 智能问答方法、装置、计算机设备和存储介质 | |
CN110334179B (zh) | 问答处理方法、装置、计算机设备和存储介质 | |
CN109800307B (zh) | 产品评价的分析方法、装置、计算机设备及存储介质 | |
CN111062217B (zh) | 语言信息的处理方法、装置、存储介质及电子设备 | |
CN109344242B (zh) | 一种对话问答方法、装置、设备及存储介质 | |
CN111400340B (zh) | 一种自然语言处理方法、装置、计算机设备和存储介质 | |
CN109087205A (zh) | 舆情指数的预测方法及装置、计算机设备和可读存储介质 | |
CN115599901B (zh) | 基于语义提示的机器问答方法、装置、设备及存储介质 | |
CN110309504B (zh) | 基于分词的文本处理方法、装置、设备及存储介质 | |
CN112766319A (zh) | 对话意图识别模型训练方法、装置、计算机设备及介质 | |
CN114139551A (zh) | 意图识别模型的训练方法及装置、意图识别的方法及装置 | |
CN110931012A (zh) | 答复消息生成方法、装置、计算机设备和存储介质 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN112989829B (zh) | 一种命名实体识别方法、装置、设备及存储介质 | |
CN113343711B (zh) | 工单生成方法、装置、设备及存储介质 | |
CN112417875B (zh) | 配置信息的更新方法、装置、计算机设备及介质 | |
CN109344385B (zh) | 自然语言处理方法、装置、计算机设备和存储介质 | |
CN116644148A (zh) | 关键词识别方法、装置、电子设备及存储介质 | |
CN116186219A (zh) | 一种人机对话交互方法方法、***及存储介质 | |
CN113095073B (zh) | 语料标签生成方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |