CN111339254A - 智能语音处理方法、装置、智能设备以及介质 - Google Patents
智能语音处理方法、装置、智能设备以及介质 Download PDFInfo
- Publication number
- CN111339254A CN111339254A CN202010119966.2A CN202010119966A CN111339254A CN 111339254 A CN111339254 A CN 111339254A CN 202010119966 A CN202010119966 A CN 202010119966A CN 111339254 A CN111339254 A CN 111339254A
- Authority
- CN
- China
- Prior art keywords
- natural language
- language processing
- processing application
- universal
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000003058 natural language processing Methods 0.000 claims abstract description 73
- 238000012545 processing Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 41
- 238000005457 optimization Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及语言处理技术领域,尤其是本发明实施例提供一种智能语音处理方法、装置、智能设备以及介质,将特定场景语料与普适性语料分离,分别处理并生成独立的应用;处理特定场景语料,构建本地语料库,生成自定义自然语言处理应用,部署在本地;处理普适性语料,训练出普适性自然语言处理应用,部署到云端;通过自定义自然语言处理应用和普适性自然语言处理应用进行处理,经过判别选择后进行输出。应对不同特定场景使用需求时,适应性较好、持续学习能力较好。
Description
技术领域
本发明涉及语言处理技术领域,尤其是一种智能语音处理方法、装置、智能设备以及介质。
背景技术
在科技发展的今天,信息迅速膨胀,自然语言理解技术已成为人们日常生活以及科技产业关注的焦点,它也是衡量机器智能化的一个智能指标。近年来随着及前期学习技术的发展以及深度学习技术应用的普及,自然语言技术也开始应用于多个领域,提高机器对自然语言的理解能力,从而降低人机沟通的门槛。
现有技术场景适应性差,现有技术往往使用预先训练好的自然语言处理应用处理待处理数据,并输出处理结果;由于训练语料、算法模型等因素的限制,所述自然语言处理应用必然无法妥善应对不同的特定场景下特殊语料输入;如果要适应新的应用环境,需要重新进行模型训练,工作量较大。
现有技术持续学习能力差,所述自然语言处理应用的训练需要较大的算力且比较耗时,从而无法及时地根据用户使用情况进行重新训练并完善。
发明人在具体实施现有技术方案时,发现现有技术存在如下技术问题:
场景适应性差,持续学习较差。
发明内容
本发明实施例的目的在于提供一种智能语音处理方法、装置、智能设备以及介质,以解决现有自然语言处理方法应对不同特定场景使用需求时,适应性较差、持续学习较差的问题。
具体技术方案如下:
第一方面,本发明实施例提供一种智能语音处理方法,所述方法具体如下:
一种智能语音处理方法,该方法包括:
接收待处理问题;
将特定场景语料与普适性语料分离,分别处理并生成独立的应用;
处理特定场景语料,构建本地语料库,生成自定义自然语言处理应用,部署在本地;
处理普适性语料,训练出普适性自然语言处理应用,部署到云端;
通过所述自定义自然语言处理应用和所述普适性自然语言处理应用进行处理,经过判别选择后进行输出。
进一步的,该方法包括:
所述自定义自然语言处理应用的核心是智能语音匹配模板,所述智能语音匹配模板包含有特定场景下的问题以及与所述问题对应的答案,所述智能语音匹配模板中的问题是一种正则表达式,将输入的问题与所述正则表达式进行匹配,匹配成功后返回所述智能语音匹配模板中的答案以及匹配度作为所述自定义自然语言处理应用的反馈。
进一步的,该方法包括:
所述普适性自然语言处理应用包含特定的分词算法、分句算法、摘要抽取算法、规则匹配算法以及停用词过滤算法等,处理成功后的反馈包括答案以及所述答案的置信度;
所述自定义自然语言处理应用和所述普适性自然语言处理应用同时处理输入语料,以所述自定义自然语言处理应用反馈的匹配率以及所述普适性自然语言处理应用反馈的置信度作为参数,输入到判别器中进行判别,选择其中一种应用的答案最为最终输出。
进一步的,该方法包括:
所述自定义自然语言处理应用进行持续学习;
语音日志工具记录每一次语料输入以及处理后的输出;
语音优化工具分析整理处理失败的对话,并提供用户编辑纠正功能。
进一步的,该方法包括:
所述语音日志工具记录每一次对话,包括输入、自定义自然语言处理应用反馈的输出、自定义自然语言处理应用反馈的匹配率、普适性自然语言处理应用反馈的输出、普适性自然语言处理应用反馈的置信度以及最终输出的选择。
进一步的,该方法包括:
所述语音优化工具允许用户手动设置特定问题的回答;
当用户从所述语音日志工具中发现未妥善处理的语料输入,可手动为此语料输入设置合适的回答;
当设置完成后,所述语音优化工具自动生成问答模板并保存到本地语料库中,完成自定义自然语言处理应用的学习。
进一步的,该方法包括:所述未妥善处理的语料输入为置信度较低的对话。
第二方面,本发明实施例提供一种智能语音处理装置,所述装置具体如下:
一种智能语音处理装置,包括检测模块、存储模块、处理模块及存储在所述存储模块上并可在所述处理模块上运行的计算机程序。
第三方面,本发明实施例提供一种智能设备,所述设备具体如下:
一种智能设备,包括处理器以及用于存储计算机指令的存储器,所述处理器运行所述计算机指令进行上述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,具体如下:
一种计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行上述的方法。
本发明的有益效果是:
本发明实施例提供一种智能语音处理方法,将特定场景语料与普适性语料分离,分别处理并生成独立的应用;处理特定场景语料,构建本地语料库,生成自定义自然语言处理应用,部署在本地;处理普适性语料,训练出普适性自然语言处理应用,部署到云端;通过自定义自然语言处理应用和普适性自然语言处理应用进行处理,经过判别选择后进行输出。应对不同特定场景使用需求时,适应性较好、持续学习能力较好;同时本发明还提供了一种智能语音处理装置、设备以及介质。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的智能语音处理方法的处理步骤图;
图2是本发明的智能语音处理方法的学习步骤图;
图3为采用的普适性应用的成功回答示例;
图4为采用普适性应用的失败回答示例;
图5为对图4进行自定义应用处理示例;
图6为采用的自定义应用的成功回答示例;
图7为采用的自定义应用的失败回答示例;
图8为对图7进行自定义修改应用处理示例。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
实施例1
如图1-2所示,图1为本发明的智能语音处理方法的处理步骤图,图2是发明的智能语音处理方法的学习步骤图。
第一方面,本发明实施例提供一种智能语音处理方法,方法具体如下:
一种智能语音处理方法,该方法包括:
接收待处理问题;
将特定场景语料与普适性语料分离,分别处理并生成独立的应用;
处理特定场景语料,构建本地语料库,生成自定义自然语言处理应用,部署在本地;
处理普适性语料,训练出普适性自然语言处理应用,部署到云端;
通过自定义自然语言处理应用和普适性自然语言处理应用进行处理,经过判别选择后进行输出。
进一步的,该方法包括:
自定义自然语言处理应用的核心是智能语音匹配模板,智能语音匹配模板包含有特定场景下的问题以及与问题对应的答案,智能语音匹配模板中的问题是一种正则表达式,将输入的问题与正则表达式进行匹配,匹配成功后返回智能语音匹配模板中的答案以及匹配度作为自定义自然语言处理应用的反馈。
例如如图3-8所示,我们分别通过普适性和自定义应用进行回答,当回答出现失败时,进行相应处理;例如当普适性应用回答出现失败时,我们利用自定义应用;当自定义应用回答出现失败时,我们修改自定义应用。
实施例2
普适性自然语言处理应用包含特定的分词算法、分句算法、摘要抽取算法、规则匹配算法以及停用词过滤算法等,处理成功后的反馈包括答案以及答案的置信度;
自定义自然语言处理应用和普适性自然语言处理应用同时处理输入语料,以自定义自然语言处理应用反馈的匹配率以及普适性自然语言处理应用反馈的置信度作为参数,输入到判别器中进行判别,选择其中一种应用的答案最为最终输出。
进一步的,该方法包括:
自定义自然语言处理应用可进行持续学习;
语音日志工具记录每一次语料输入以及处理后的输出;
语音优化工具分析整理处理失败的对话,并提供用户编辑纠正功能。
实施例3
语音日志工具记录每一次对话,包括输入、自定义自然语言处理应用反馈的输出、自定义自然语言处理应用反馈的匹配率、普适性自然语言处理应用反馈的输出、普适性自然语言处理应用反馈的置信度以及最终输出的选择,这些记录反应了当前自然语言处理方法无法妥善处理的语料输入。
实施例4
语音优化工具允许用户手动设置特定问题的回答;
当用户从语音日志工具中发现未妥善处理的语料输入,可手动为此语料输入设置合适的回答;当设置完成后,语音优化工具自动生成问答模板并保存到本地语料库中,从而提高了自定义自然语言处理应用的处理能力。
进一步的,该方法包括:未妥善处理的语料输入为置信度较低的对话。
第二方面,本发明实施例提供一种智能语音处理装置,装置具体如下:
一种智能语音处理装置,包括检测模块、存储模块、处理模块及存储在存储模块上并可在处理模块上运行的计算机程序。
第三方面,本发明实施例提供一种智能设备,设备具体如下:
一种智能设备,包括处理器以及用于存储计算机指令的存储器,处理器运行计算机指令进行上述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,具体如下:
一种计算机可读存储介质,当存储介质中的指令由处理器执行时,使得处理器能够执行上述的方法。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (10)
1.一种智能语音处理方法,其特征在于,该方法包括:
接收待处理问题;
将特定场景语料与普适性语料分离,分别处理并生成独立的应用;
处理特定场景语料,构建本地语料库,生成自定义自然语言处理应用,部署在本地;
处理普适性语料,训练出普适性自然语言处理应用,部署到云端;
通过所述自定义自然语言处理应用和所述普适性自然语言处理应用进行处理,经过判别选择后进行输出。
2.根据权利要求1所述的一种智能语音处理方法,其特征在于,该方法包括:
所述自定义自然语言处理应用的核心是智能语音匹配模板,所述智能语音匹配模板包含有特定场景下的问题以及与所述问题对应的答案,所述智能语音匹配模板中的问题是一种正则表达式,将输入的问题与所述正则表达式进行匹配,匹配成功后返回所述智能语音匹配模板中的答案以及匹配度作为所述自定义自然语言处理应用的反馈。
3.根据权利要求2所述的一种智能语音处理方法,其特征在于,该方法包括:
所述普适性自然语言处理应用包含特定的分词算法、分句算法、摘要抽取算法、规则匹配算法以及停用词过滤算法等,处理成功后的反馈包括答案以及所述答案的置信度;
所述自定义自然语言处理应用和所述普适性自然语言处理应用同时处理输入语料,以所述自定义自然语言处理应用反馈的匹配率以及所述普适性自然语言处理应用反馈的置信度作为参数,输入到判别器中进行判别,选择其中一种应用的答案最为最终输出。
4.根据权利要求3所述的一种智能语音处理方法,其特征在于,该方法包括:
所述自定义自然语言处理应用可进行持续学习;
语音日志工具记录每一次语料输入以及处理后的输出;
语音优化工具分析整理处理失败的对话,并提供用户编辑纠正功能。
5.根据权利要求4所述的一种智能语音处理方法,其特征在于,该方法包括:
所述语音日志工具记录每一次对话,包括输入、自定义自然语言处理应用反馈的输出、自定义自然语言处理应用反馈的匹配率、普适性自然语言处理应用反馈的输出、普适性自然语言处理应用反馈的置信度以及最终输出的选择。
6.根据权利要求5所述的一种智能语音处理方法,其特征在于,该方法包括:
所述语音优化工具允许用户手动设置特定问题的回答;
当用户从所述语音日志工具中发现未妥善处理的语料输入,可手动为此语料输入设置合适的回答;
当设置完成后,所述语音优化工具自动生成问答模板并保存到本地语料库中,完成自定义自然语言处理应用的学习。
7.根据权利要求6所述的一种智能语音处理方法,其特征在于,该方法包括:所述未妥善处理的语料输入为置信度较低的对话。
8.一种智能语音处理装置,其特征在于,包括检测模块、存储模块、处理模块及存储在所述存储模块上并可在所述处理模块上运行的计算机程序。
9.一种智能设备,其特征在于,包括处理器以及用于存储计算机指令的存储器,所述处理器运行所述计算机指令进行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由处理器执行时,使得处理器能够执行权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010119966.2A CN111339254A (zh) | 2020-02-26 | 2020-02-26 | 智能语音处理方法、装置、智能设备以及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010119966.2A CN111339254A (zh) | 2020-02-26 | 2020-02-26 | 智能语音处理方法、装置、智能设备以及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111339254A true CN111339254A (zh) | 2020-06-26 |
Family
ID=71181841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010119966.2A Pending CN111339254A (zh) | 2020-02-26 | 2020-02-26 | 智能语音处理方法、装置、智能设备以及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111339254A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和*** |
CN106874441A (zh) * | 2017-02-07 | 2017-06-20 | 腾讯科技(上海)有限公司 | 智能问答方法和装置 |
CN107679231A (zh) * | 2017-10-24 | 2018-02-09 | 济南浪潮高新科技投资发展有限公司 | 一种垂直领域与开放领域混合型智能问答***的实现方法 |
-
2020
- 2020-02-26 CN CN202010119966.2A patent/CN111339254A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和*** |
CN106874441A (zh) * | 2017-02-07 | 2017-06-20 | 腾讯科技(上海)有限公司 | 智能问答方法和装置 |
CN107679231A (zh) * | 2017-10-24 | 2018-02-09 | 济南浪潮高新科技投资发展有限公司 | 一种垂直领域与开放领域混合型智能问答***的实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114722839B (zh) | 人机协同对话交互***及方法 | |
CN111611382A (zh) | 话术模型训练方法、对话信息生成方法及装置、*** | |
CN111091809B (zh) | 一种深度特征融合的地域性口音识别方法及装置 | |
CN106845628A (zh) | 机器人通过互联网自主学习生成新指令的方法和装置 | |
CN112364132A (zh) | 基于依存句法的相似度计算模型和***及搭建***的方法 | |
CN116756047B (zh) | 一种基于gpt的车辆控制器的软件开发方法及*** | |
CN110442855A (zh) | 一种语音分析方法和*** | |
CN116226338A (zh) | 基于检索和生成融合的多轮对话***及方法 | |
CN115064154A (zh) | 混合语言语音识别模型的生成方法及装置 | |
CN208284230U (zh) | 一种语音识别装置、语音识别***及智能设备 | |
CN114360584A (zh) | 一种基于音素级的语音情感分层式识别方法及*** | |
CN111160512A (zh) | 基于生成式对抗网络构建双判别器对话生成模型的方法 | |
CN111339254A (zh) | 智能语音处理方法、装置、智能设备以及介质 | |
CN116681088A (zh) | 一种基于大模型的翻译***、方法及储存介质 | |
CN112131879A (zh) | 一种关系抽取***、方法和装置 | |
CN114116975A (zh) | 一种多意图识别方法及*** | |
KR102600839B1 (ko) | 문장 유사관계 예측 모델을 이용한 요약 문서 생성 방법 및 장치, 요약 문서를 생성하는데 이용되는 문장 유사관계 예측 모델을 학습시키는 방법 및 장치 | |
CN115394288B (zh) | 民航多语种无线电陆空通话的语种识别方法及*** | |
CN109101499B (zh) | 基于神经网络的人工智能语音学习方法 | |
CN114519357B (zh) | 基于机器学习的自然语言处理方法和*** | |
CN118331152A (zh) | 基于自然语言大模型的工业控制***逻辑优化方法及*** | |
CN109241539B (zh) | 机器学习人工智能翻译数据库的更新方法 | |
CN118016060A (zh) | 一种智能语音机器人***的人机对话流畅度优化方法 | |
CN118245613A (zh) | 一种基于大模型的客服知识库扩充方法、***及装置 | |
CN118468818A (zh) | 一种基于判别式生成模型的文本处理方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200626 |
|
RJ01 | Rejection of invention patent application after publication |