CN115567645A - 基于智能外呼机器人的语音数据处理方法及装置 - Google Patents
基于智能外呼机器人的语音数据处理方法及装置 Download PDFInfo
- Publication number
- CN115567645A CN115567645A CN202210954076.2A CN202210954076A CN115567645A CN 115567645 A CN115567645 A CN 115567645A CN 202210954076 A CN202210954076 A CN 202210954076A CN 115567645 A CN115567645 A CN 115567645A
- Authority
- CN
- China
- Prior art keywords
- voice data
- voice
- content
- data processing
- processing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000000605 extraction Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 22
- 238000013518 transcription Methods 0.000 claims description 12
- 230000035897 transcription Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000011217 control strategy Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/527—Centralised call answering arrangements not requiring operator intervention
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种基于智能外呼机器人的语音数据处理方法及装置,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
Description
技术领域
本发明涉及语音处理技术领域,特别是涉及一种基于智能外呼机器人的语音数据处理方法及装置。
背景技术
智能外呼是综合利用自动语音识别(Automatic Speech Recognition,ASR)、文字转语音(Text To Speech,TTS)以及自然语言理解(Natural Language Understanding,简称NLU)技术并面向用户提供的一款智能机器人产品。智能外呼机器人可根据业务场景,自动发起机器人电话外呼任务,通过人与机器人的语音对话交互收集业务结果,并对数据加以统计处理。
因此,智能外呼机器人被广泛应用至各个领域。尤其是在医疗领域中,利用智能外呼机器人应对基层医疗和公共卫生防护等大信息量的场景,可以有效地提升语音数据处理效率。然而,在智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,导致智能外呼机器人所需处理的语音复杂且不规则,影响语音数据处理的效率和准确率。
发明内容
基于此,有必要针对在智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,导致智能外呼机器人所需处理的语音复杂且不规则,影响语音数据处理的效率和准确率这一不足,提供一种基于智能外呼机器人的语音数据处理方法及装置。
一种基于智能外呼机器人的语音数据处理方法,包括步骤:
获取待处理语音并处理成转写内容;
提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
根据所述持续对话采集医疗数据并执行标准化处理,获得所述语音处理。
上述的基于智能外呼机器人的语音数据处理方法,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
在其中一个实施例中,提升所述转写内容的可读性的过程,包括步骤:
基于多信息融合及基于声学属性识别的声学置信度,结合语义信息,以提升异常语音的检测能力。
在其中一个实施例中,提升所述转写内容的可读性的过程,包括步骤:
组合CRF模型的标点技术、基于CRF模型的句子顺滑及基于最大熵模型的关键信息抽取,提升所述转写内容的可读性。
在其中一个实施例中,对所述转写内容进行划分处理的过程,包括步骤:
基于句子级别语义聚类和关联逻辑关系的分析,以及特殊的提示型词汇、停顿长度,将所述转写内容切分为语义相对独立的若干个段落,以执行划分处理。
在其中一个实施例中,执行关键信息、摘要提取,获得语义内容的过程,包括步骤:
基于文本自动摘要,根据所述待处理语音中说话人信息、语气强调重复信息,执行关键信息、摘要提取。
在其中一个实施例中,根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,包括步骤:
建立对所述用户的对话状态跟踪;
基于最大熵的对话控制策略,在所述对话状态跟踪的基础上,最大化所述医疗知识库信息,基于目标驱动的策略生成***响应,引导用户进行持续对话。
在其中一个实施例中,根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据的过程,包括步骤:
根据医学本体知识库执行标准化处理,获得语音数据。
一种基于智能外呼机器人的语音数据处理装置,包括:
语音转写模块,用于获取待处理语音并处理成转写内容;
语义提取模块,用于提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
对话建立模块,用于根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
语音处理模块,用于根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据。
上述的基于智能外呼机器人的语音数据处理方法,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
一种计算机存储介质,其上存储有计算机指令,计算机指令被处理器执行时实现上述任一实施例的基于智能外呼机器人的语音数据处理方法。
上述的计算机存储介质,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述任一实施例的基于智能外呼机器人的语音数据处理方法。
上述的计算机设备,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
附图说明
图1为一实施方式的基于智能外呼机器人的语音数据处理方法流程图;
图2为另一实施方式的基于智能外呼机器人的语音数据处理方法流程图;
图3为一实施方式的基于智能外呼机器人的语音数据处理装置模块结构图;
图4为一实施方式的计算机内部构造示意图。
具体实施方式
为了更好地理解本发明的目的、技术方案以及技术效果,以下结合附图和实施例对本发明进行进一步的讲解说明。同时声明,以下所描述的实施例仅用于解释本发明,并不用于限定本发明。
本发明实施例提供了一种基于智能外呼机器人的语音数据处理方法。
图1为一实施方式的基于智能外呼机器人的语音数据处理方法流程图,如图1所示,一实施方式的基于智能外呼机器人的语音数据处理方法包括步骤S100至步骤S103:
S100,获取待处理语音并处理成转写内容;
S101,提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
S102,根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
S103,根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据。
智能外呼机器人与说话人执行的语音交互,获取说话人的语音作为待处理语音。将待处理语音处理成转写内容,其中,转写内容为待处理语音的对应文字文本。
在其中一个实施例中,图2为另一实施方式的基于智能外呼机器人的语音数据处理方法流程图,如图2所示,步骤S101中提升所述转写内容的可读性的过程,包括步骤S200和步骤S201:
S200,基于多信息融合及基于声学属性识别的声学置信度,结合语义信息,以提升异常语音的检测能力。
S201,组合CRF模型的标点技术、基于CRF模型的句子顺滑及基于最大熵模型的关键信息抽取,提升所述转写内容的可读性。
其中,使用基于多信息融合及基于声学属性识别的声学置信度技术,并结合语义信息,进一步提升异常语音的检测能力;计基于CRF(Conditional Random Field)模型的标点技术、基于CRF模型的句子顺滑及基于最大熵模型的关键信息抽取等技术,通过组合,进一步改善转写内容的可阅读性。
在其中一个实施例中,如图2所示,步骤S101中对所述转写内容进行划分处理的过程,包括步骤S202:
S202,基于句子级别语义聚类和关联逻辑关系的分析,以及特殊的提示型词汇、停顿长度,将所述转写内容切分为语义相对独立的若干个段落,以执行划分处理。
其中,基于句子级别语义聚类和关联逻辑关系的分析,以及一些特殊的提示型词汇、停顿长度等额外信息,将较长的内容转写结果切分为语义相对独立的若干个段落,为关键信息和摘要做准备。
在其中一个实施例中,如图2所示,步骤S101中对执行关键信息、摘要提取,获得语义内容的过程,包括步骤S203:
S203,基于文本自动摘要,根据所述待处理语音中说话人信息、语气强调重复信息,执行关键信息、摘要提取。
在其中一个实施例中,可借鉴传统的文本自动摘要,并根据语音中说话人、语气强调重复等信息,对每一段语音进行关键信息的抽取和自动摘要。
在其中一个实施例中,如图2所示,步骤S102中根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,包括步骤S300和步骤S301:
S300,建立对所述用户的对话状态跟踪;
S301,基于最大熵的对话控制策略,在所述对话状态跟踪的基础上,最大化所述医疗知识库信息,基于目标驱动的策略生成***响应,引导用户进行持续对话。
在其中一个实施例中,通过持续对话***的形式化描述,建立一个可被计算机理解和计算的对话模型,便于机器理解和进行后续的对话管理技术实现。
在其中一个实施例中,通过多轮对话的语言理解,对自然语言形式的用户输入进行理解口语理解,或使用自然语言处理的方法从文本形式的用户响应中提取语义信息。
在其中一个实施例中,通过对话状态跟踪,根据用户的当前输入以及历史交互信息,基于对话概率框架的形式和描述方案对交互信息进行总结和简化,形成基于目标分布的可跟踪的对话状态。
在其中一个实施例中,通过基于最大熵的对话控制策略,在对话跟踪的基础上,根据当前***状态,最大化利用健康医疗知识库信息,基于目标驱动的策略生成***响应,引导用户进行持续对话。
在其中一个实施例中,如图2所示,步骤S103中根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据的过程,包括步骤S400:
S400,根据医学本体知识库执行标准化处理,获得语音数据。
其中,通过引入医学本体知识库作为医疗数据的被采集对象。
其中,对采集到的医疗数据进行分析需要进行相应调整。首先,医疗信息***不是为了科研和数据分析设计的。从数据分析的角度看,医疗数据通常比较复杂,数据的异构度较大,存在很多缺失信息和不一致信息。其次,理解医疗数据通常需要不同领域的知识,包括医学,生物统计学,流行病学和信息学等。医学术语和本体知识库医学术语提供了标准化描述并减少歧义的医学术语,而医学本体知识库进一步提供了标准化且一致的医学本体词汇来描述医学概念和概念之间的关系。通过使用医学术语和本体知识库,复杂、异构的医疗数据之间可以相互交流,使后续的语音处理得以进行,确定相应的语音数据。。
上述任一实施例的基于智能外呼机器人的语音数据处理方法,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
本发明实施例还提供了一种基于智能外呼机器人的语音数据处理装置。
图3为一实施方式的基于智能外呼机器人的语音数据处理装置模块结构图,如图3所示,一实施方式的基于智能外呼机器人的语音数据处理装置包括:
语音转写模块100,用于获取待处理语音并处理成转写内容;
语义提取模块101,用于提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
对话建立模块102,用于根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
语音处理模块103,用于根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据。
上述的基于智能外呼机器人的语音数据处理装置,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
本发明实施例还提供了一种计算机存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述任一实施例的应用于机器人的语音处理方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存划痕属性信息储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、终端、或者网络设备等)执行本发明各个实施例方法的全部或部分。而前述的存储介质包括:移动存储设备、RAM、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
与上述的计算机存储介质对应的是,在一个实施例中还提供一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行程序时实现如上述各实施例中的任意一种应用于机器人的语音处理方法。
该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种应用于机器人的语音处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
上述的计算机设备,在获取待处理语音并处理成转写内容后,提升转写内容的可读性,并对转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,根据持续对话采集医疗数据并执行标准化处理,获得语音数据。基于此,针对智能外呼机器人应用至医疗领域中时,面向的对象存在多样化特点,提高语音数据的识别效率和准确性。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于智能外呼机器人的语音数据处理方法,其特征在于,包括步骤:
获取待处理语音并处理成转写内容;
提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据。
2.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述提升所述转写内容的可读性的过程,包括步骤:
基于多信息融合及基于声学属性识别的声学置信度,结合语义信息,以提升异常语音的检测能力。
3.根据权利要求1或2所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述提升所述转写内容的可读性的过程,包括步骤:
组合CRF模型的标点技术、基于CRF模型的句子顺滑及基于最大熵模型的关键信息抽取,提升所述转写内容的可读性。
4.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述对所述转写内容进行划分处理的过程,包括步骤:
基于句子级别语义聚类和关联逻辑关系的分析,以及特殊的提示型词汇、停顿长度,将所述转写内容切分为语义相对独立的若干个段落,以执行划分处理。
5.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述执行关键信息、摘要提取,获得语义内容的过程,包括步骤:
基于文本自动摘要,根据所述待处理语音中说话人信息、语气强调重复信息,执行关键信息、摘要提取。
6.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话,包括步骤:
建立对所述用户的对话状态跟踪;
基于最大熵的对话控制策略,在所述对话状态跟踪的基础上,最大化所述医疗知识库信息,基于目标驱动的策略生成***响应,引导用户进行持续对话。
7.根据权利要求1所述的基于智能外呼机器人的语音数据处理方法,其特征在于,所述根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据的过程,包括步骤:
根据医学本体知识库执行标准化处理,获得语音数据。
8.一种基于智能外呼机器人的语音数据处理装置,其特征在于,包括:
语音转写模块,用于获取待处理语音并处理成转写内容;
语义提取模块,用于提升所述转写内容的可读性,并对所述转写内容进行划分处理,以及执行关键信息、摘要提取,获得语义内容;
对话建立模块,用于根据语义内容建立多轮对话管理,基于医疗知识库信息引导用户执行持续对话;
语音处理模块,用于根据所述持续对话采集医疗数据并执行标准化处理,获得语音数据。
9.一种计算机存储介质,其上存储有计算机指令,其特征在于,所述计算机指令被处理器执行时实现如权利要求1至7任意一项所述的基于智能外呼机器人的语音数据处理方法。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行程序时实现如权利要求1至7任意一项所述的基于智能外呼机器人的语音数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210954076.2A CN115567645A (zh) | 2022-08-10 | 2022-08-10 | 基于智能外呼机器人的语音数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210954076.2A CN115567645A (zh) | 2022-08-10 | 2022-08-10 | 基于智能外呼机器人的语音数据处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115567645A true CN115567645A (zh) | 2023-01-03 |
Family
ID=84739555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210954076.2A Pending CN115567645A (zh) | 2022-08-10 | 2022-08-10 | 基于智能外呼机器人的语音数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115567645A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866090A (zh) * | 2019-11-14 | 2020-03-06 | 百度在线网络技术(北京)有限公司 | 用于语音交互的方法、装置、电子设备和计算机存储介质 |
CN112492111A (zh) * | 2020-11-25 | 2021-03-12 | 苏宁金融科技(南京)有限公司 | 一种智能语音外呼方法、装置、计算机设备和存储介质 |
CN114254587A (zh) * | 2021-12-15 | 2022-03-29 | 科大讯飞股份有限公司 | 主题段落划分方法、装置、电子设备及存储介质 |
-
2022
- 2022-08-10 CN CN202210954076.2A patent/CN115567645A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866090A (zh) * | 2019-11-14 | 2020-03-06 | 百度在线网络技术(北京)有限公司 | 用于语音交互的方法、装置、电子设备和计算机存储介质 |
CN112492111A (zh) * | 2020-11-25 | 2021-03-12 | 苏宁金融科技(南京)有限公司 | 一种智能语音外呼方法、装置、计算机设备和存储介质 |
CN114254587A (zh) * | 2021-12-15 | 2022-03-29 | 科大讯飞股份有限公司 | 主题段落划分方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109509470B (zh) | 语音交互方法、装置、计算机可读存储介质及终端设备 | |
CN110444198B (zh) | 检索方法、装置、计算机设备和存储介质 | |
CN105931644B (zh) | 一种语音识别方法及移动终端 | |
CN110472224B (zh) | 服务质量的检测方法、装置、计算机设备和存储介质 | |
US10592611B2 (en) | System for automatic extraction of structure from spoken conversation using lexical and acoustic features | |
CN110148416A (zh) | 语音识别方法、装置、设备和存储介质 | |
US7974843B2 (en) | Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer | |
EP2660810B1 (en) | Post processing of natural language ASR | |
JP2021533397A (ja) | 話者埋め込みと訓練された生成モデルとを使用する話者ダイアライゼーション | |
CN110689877A (zh) | 一种语音结束端点检测方法及装置 | |
CN111627432B (zh) | 主动式外呼智能语音机器人多语种交互方法及装置 | |
CN112673421A (zh) | 训练和/或使用语言选择模型以自动确定用于口头话语的话音辨识的语言 | |
WO2020024620A1 (zh) | 语音信息的处理方法以及装置、设备和存储介质 | |
US11961515B2 (en) | Contrastive Siamese network for semi-supervised speech recognition | |
CN112669842A (zh) | 人机对话控制方法、装置、计算机设备及存储介质 | |
JP6875819B2 (ja) | 音響モデル入力データの正規化装置及び方法と、音声認識装置 | |
CN112071310A (zh) | 语音识别方法和装置、电子设备和存储介质 | |
US10803853B2 (en) | Audio transcription sentence tokenization system and method | |
CN110931002B (zh) | 人机交互方法、装置、计算机设备和存储介质 | |
CN112199498A (zh) | 一种养老服务的人机对话方法、装置、介质及电子设备 | |
CN115567645A (zh) | 基于智能外呼机器人的语音数据处理方法及装置 | |
CN115376558A (zh) | 角色识别方法、装置、计算机设备及存储介质 | |
Gupta et al. | Desktop Voice Assistant | |
CN114707515A (zh) | 话术判别方法、装置、电子设备及存储介质 | |
US11861521B2 (en) | System and method for identification and verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |