CN108549628A - 流式自然语言信息的断句装置及方法 - Google Patents
流式自然语言信息的断句装置及方法 Download PDFInfo
- Publication number
- CN108549628A CN108549628A CN201810218878.0A CN201810218878A CN108549628A CN 108549628 A CN108549628 A CN 108549628A CN 201810218878 A CN201810218878 A CN 201810218878A CN 108549628 A CN108549628 A CN 108549628A
- Authority
- CN
- China
- Prior art keywords
- punctuate
- recognition result
- voice recognition
- sequential
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000002776 aggregation Effects 0.000 claims abstract description 16
- 238000004220 aggregation Methods 0.000 claims abstract description 16
- 230000011218 segmentation Effects 0.000 claims abstract description 15
- 238000005457 optimization Methods 0.000 claims description 24
- 230000032696 parturition Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种流式自然语言信息的断句装置及方法,其中,所述装置包括:语音识别模块,用于按照指定频率输出带有时序的语音识别结果;信息流聚合模块,用于形成语音识别结果序列;动态窗口设定模块,用于选择指定范围的文本;断句识别模块,用于根据分析得到的语义确定所述指定范围的文本中的分割点;句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。本发明提供的技术方案,能够提高断句的准确性,并且可以实现断句修正能力。
Description
技术领域
本发明涉及语音识别技术领域,特别涉及一种流式自然语言信息的断句装置及方法。
背景技术
随着语音识别技术的不断发展,当前越来越多的软件支持语音识别功能,可以将语音识别为文字,并向用户展示识别出的文字。
现有的语音处理方案是先用语音活动检测模块对语音进行断句,再将断开的语音进行自动语音识别。
然而,现有语音处理方案存在断句不准确的问题,同时对时序上断错的文本缺乏可回溯的断句修正能力。
发明内容
本发明提供一种流式自然语言信息的断句装置及方法,能够提高断句的准确性,并且可以实现断句修正能力。
为实现上述目的,本申请提供一种流式自然语言信息的断句装置,所述装置包括:语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。
进一步地,所述信息流聚合模块包括时序整合单元,所述时序整合单元用于根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
进一步地,所述信息流聚合模块包括优化处理单元,所述优化处理单元用于在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
进一步地,所述断句识别模块包括分词单元和语言模型单元,其中:
所述分词单元,用于为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
所述语言模型单元,用于接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
进一步地,所述句子注册模块包括注册单元和修正单元,其中:
所述注册单元,用于判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并将所述当前断句传送至所述句子输出模块;
所述修正单元,用于若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
为实现上述目的,本申请提供一种流式自然语言信息的断句方法,所述方法包括:接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;输出未曾注册过的断句以及经过修正的断句。
进一步地,整合经过优化处理后的带有时序的语音识别结果包括:
根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
进一步地,对所述带有时序的语音识别结果进行优化处理包括:
在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
进一步地,根据分析得到的语义确定所述指定范围的文本中的分割点包括:
为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
进一步地,所述方法还包括:
判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并输出所述当前断句;
若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
由上可见,本申请提供的技术方案,包括语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。由上可见,与传统的断句只利用声学特征进行语音断句相比,本申请结合文本语义信息对语音流进行断句,提高了语音断句的准确率,同时对时序上断错的文本有可回溯的修正能力,大大提高了人机交互友好性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明实施方式中流式自然语言信息的断句装置的结构示意图;
图2是本发明实施方式中流式自然语言信息的断句方法流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1,本申请提供一种流式自然语言信息的断句装置,所述装置包括:语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:
所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。
在一个实施方式中,所述信息流聚合模块包括时序整合单元,所述时序整合单元用于根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
在一个实施方式中,所述信息流聚合模块包括优化处理单元,所述优化处理单元用于在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
在一个实施方式中,所述断句识别模块包括分词单元和语言模型单元,其中:
所述分词单元,用于为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
例如,标签可以分为B,E,I,S,这四个标签分别表示:beginning(开头),inside(中间),ending(结尾),single(单独),也就是一个词的开始,中间,结束以及单个字的词。例如“南京市长江大桥”的标注结果可能为:“南(B)京(I)市(E)长(B)江(E)大(B)桥(E)”。
所述语言模型单元,用于接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
所述预设语言模型例如可以是N-Gram语言模型,Class-based n-gram模型,topic-based n-gram模型,cache-based n-gram模型,skipping n-gram模型,指数语言模型(最大熵模型,条件随机域模型),神经网络语言模型等。
在一个实施方式中,所述句子注册模块包括注册单元和修正单元,其中:
所述注册单元,用于判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并将所述当前断句传送至所述句子输出模块;
所述修正单元,用于若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
具体地,在实现本申请技术方案时,可以包括多个步骤:
第1步:语音识别模块识别语音实时流,并按照一定的频率输出带有时序的语音识别结果。
第2步:信息流聚合模块用于接受并整合时序语音识别结果,形成语音识别结果时间序列。功能包括附加新的语音识别结果、删除无效的语音识别结果、修正不顺滑的语音识别结果。
第3步:动态窗口设定模块从语音识别结果时序中选择一块合适的范围用于断句分析。
第4步:断句模块结合语义完整性判断动态窗口范围内应该断句的分割点。
第5步:句子注册模块用于将分割好的句子注册到时间轴上。据此可以判断生成的句子在相同的时间轴上是否曾经生成过,以及是否有必要对曾经生成过的句子进行修正。
第6步:句子输出模块将不曾注册过的新句子以及修正过的句子输出。
请参阅图2,本申请还提供一种流式自然语言信息的断句方法,所述方法包括:
S1:接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
S2:对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
S3:从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
S4:分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
S5:将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
S6:输出未曾注册过的断句以及经过修正的断句。
在一个实施方式中,整合经过优化处理后的带有时序的语音识别结果包括:
根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
在一个实施方式中,对所述带有时序的语音识别结果进行优化处理包括:
在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
在一个实施方式中,根据分析得到的语义确定所述指定范围的文本中的分割点包括:
为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
在一个实施方式中,所述方法还包括:
判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并输出所述当前断句;
若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
由上可见,本申请提供的技术方案,包括语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。由上可见,与传统的断句只利用声学特征进行语音断句相比,本申请结合文本语义信息对语音流进行断句,提高了语音断句的准确率,同时对时序上断错的文本有可回溯的修正能力,大大提高了人机交互友好性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种流式自然语言信息的断句装置,其特征在于,所述装置包括:语音识别模块、信息流聚合模块、动态窗口设定模块、断句识别模块、句子注册模块以及句子输出模块,其中:
所述语音识别模块,用于接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
所述信息流聚合模块,用于对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
所述动态窗口设定模块,用于从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
所述断句识别模块,用于分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
所述句子注册模块,用于将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
所述句子输出模块,用于输出未曾注册过的断句以及经过修正的断句。
2.根据权利要求1所述的装置,其特征在于,所述信息流聚合模块包括时序整合单元,所述时序整合单元用于根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
3.根据权利要求1所述的装置,其特征在于,所述信息流聚合模块包括优化处理单元,所述优化处理单元用于在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
4.根据权利要求1所述的装置,其特征在于,所述断句识别模块包括分词单元和语言模型单元,其中:
所述分词单元,用于为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
所述语言模型单元,用于接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
5.根据权利要求1所述的装置,其特征在于,所述句子注册模块包括注册单元和修正单元,其中:
所述注册单元,用于判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并将所述当前断句传送至所述句子输出模块;
所述修正单元,用于若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
6.一种流式自然语言信息的断句方法,其特征在于,所述方法包括:
接收并识别语音实时流,并按照指定频率输出带有时序的语音识别结果;
对所述带有时序的语音识别结果进行优化处理,并整合经过优化处理后的带有时序的语音识别结果,以形成语音识别结果序列;
从所述语音识别结果序列中选择指定范围的文本,所述指定范围的文本用于进行断句分析;
分析所述指定范围的文本的语义,并根据分析得到的语义确定所述指定范围的文本中的分割点,所述分割点用于将所述指定范围的文本划分为多个断句;
将分割得到的多个断句注册至时间轴上,并基于当前注册的断句,对之前注册过的断句进行修正;
输出未曾注册过的断句以及经过修正的断句。
7.根据权利要求6所述的方法,其特征在于,整合经过优化处理后的带有时序的语音识别结果包括:
根据时序从先到后的顺序,将经过优化处理后的带有时序的语音识别结果依次进行连接,得到语音识别结果序列。
8.根据权利要求6所述的方法,其特征在于,对所述带有时序的语音识别结果进行优化处理包括:
在所述带有时序的语音识别结果中添加新的语音识别结果,或者从所述带有时序的语音识别结果中删除无效的语音识别结果,或者在所述带有时序的语音识别结果修正不符合语言排列规则的语音识别结果。
9.根据权利要求6所述的方法,其特征在于,根据分析得到的语义确定所述指定范围的文本中的分割点包括:
为所述指定范围的文本中的各个字符标注标签,并基于标注的标签,将所述指定范围的文本拆分为多个词汇;
接收拆分得到的所述多个词汇,并按照预设语言模型计算由所述多个词汇中部分词汇构成具备完整语义的断句的概率,并将概率最大的断句作为划分得到的一个断句。
10.根据权利要求6所述的方法,其特征在于,所述方法还包括:
判断分割得到的当前断句在相同的时间轴上是否生成过;若未生成过,将所述当前断句在时间轴上注册,并输出所述当前断句;
若分割得到的当前断句在相同的时间轴上生成过,根据所述当前断句的语义,判断是否需要对之前生成过的断句进行修正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810218878.0A CN108549628B (zh) | 2018-03-16 | 2018-03-16 | 流式自然语言信息的断句装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810218878.0A CN108549628B (zh) | 2018-03-16 | 2018-03-16 | 流式自然语言信息的断句装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108549628A true CN108549628A (zh) | 2018-09-18 |
CN108549628B CN108549628B (zh) | 2021-08-27 |
Family
ID=63516525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810218878.0A Active CN108549628B (zh) | 2018-03-16 | 2018-03-16 | 流式自然语言信息的断句装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108549628B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111161711A (zh) * | 2020-04-01 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 对流式语音识别文本进行断句的方法及装置 |
CN111160003A (zh) * | 2018-11-07 | 2020-05-15 | 北京猎户星空科技有限公司 | 一种断句方法及装置 |
CN111259163A (zh) * | 2020-01-14 | 2020-06-09 | 北京明略软件***有限公司 | 一种知识图谱的生成方法和装置及计算机可读存储介质 |
CN111627423A (zh) * | 2019-02-27 | 2020-09-04 | 百度在线网络技术(北京)有限公司 | Vad尾点检测方法、装置、服务器和计算机可读介质 |
CN111797632A (zh) * | 2019-04-04 | 2020-10-20 | 北京猎户星空科技有限公司 | 信息处理方法、装置及电子设备 |
CN113628626A (zh) * | 2020-05-09 | 2021-11-09 | 阿里巴巴集团控股有限公司 | 语音识别方法、装置和***以及翻译方法和*** |
CN114420102A (zh) * | 2022-01-04 | 2022-04-29 | 广州小鹏汽车科技有限公司 | 语音断句方法、装置、电子设备及存储介质 |
CN114648984A (zh) * | 2022-05-23 | 2022-06-21 | 深圳华策辉弘科技有限公司 | 音频断句方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140280072A1 (en) * | 2013-03-14 | 2014-09-18 | Advanced Search Laboratories, lnc. | Method and Apparatus for Human-Machine Interaction |
US20140358879A1 (en) * | 2012-05-31 | 2014-12-04 | International Business Machines Corporation | Search engine suggestion |
CN105895103A (zh) * | 2015-12-03 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 一种语音识别方法及装置 |
CN106503123A (zh) * | 2016-10-20 | 2017-03-15 | 宁波江东大金佰汇信息技术有限公司 | 一种基于计算机云数据的深度学习智能应答*** |
CN106547737A (zh) * | 2016-10-25 | 2017-03-29 | 复旦大学 | 基于深度学习的自然语言处理中的序列标注方法 |
CN107315737A (zh) * | 2017-07-04 | 2017-11-03 | 北京奇艺世纪科技有限公司 | 一种语义逻辑处理方法及*** |
CN107797984A (zh) * | 2017-09-11 | 2018-03-13 | 远光软件股份有限公司 | 智能交互方法、设备及存储介质 |
-
2018
- 2018-03-16 CN CN201810218878.0A patent/CN108549628B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140358879A1 (en) * | 2012-05-31 | 2014-12-04 | International Business Machines Corporation | Search engine suggestion |
US20140280072A1 (en) * | 2013-03-14 | 2014-09-18 | Advanced Search Laboratories, lnc. | Method and Apparatus for Human-Machine Interaction |
CN105895103A (zh) * | 2015-12-03 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 一种语音识别方法及装置 |
CN106503123A (zh) * | 2016-10-20 | 2017-03-15 | 宁波江东大金佰汇信息技术有限公司 | 一种基于计算机云数据的深度学习智能应答*** |
CN106547737A (zh) * | 2016-10-25 | 2017-03-29 | 复旦大学 | 基于深度学习的自然语言处理中的序列标注方法 |
CN107315737A (zh) * | 2017-07-04 | 2017-11-03 | 北京奇艺世纪科技有限公司 | 一种语义逻辑处理方法及*** |
CN107797984A (zh) * | 2017-09-11 | 2018-03-13 | 远光软件股份有限公司 | 智能交互方法、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
SINISA HUSNJAK 等: ""Possibilities of Using Speech Recognition Systems of Smart Terminal Devices in Traffic Environment"", 《PROCEDIA ENGINEERING》 * |
刘长征 等: ""语音识别中卷积神经网络优化算法"", 《哈尔滨理工大学学报》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111160003A (zh) * | 2018-11-07 | 2020-05-15 | 北京猎户星空科技有限公司 | 一种断句方法及装置 |
CN111160003B (zh) * | 2018-11-07 | 2023-12-08 | 北京猎户星空科技有限公司 | 一种断句方法及装置 |
CN111627423B (zh) * | 2019-02-27 | 2023-08-04 | 百度在线网络技术(北京)有限公司 | Vad尾点检测方法、装置、服务器和计算机可读介质 |
CN111627423A (zh) * | 2019-02-27 | 2020-09-04 | 百度在线网络技术(北京)有限公司 | Vad尾点检测方法、装置、服务器和计算机可读介质 |
CN111797632A (zh) * | 2019-04-04 | 2020-10-20 | 北京猎户星空科技有限公司 | 信息处理方法、装置及电子设备 |
CN111797632B (zh) * | 2019-04-04 | 2023-10-27 | 北京猎户星空科技有限公司 | 信息处理方法、装置及电子设备 |
CN111259163A (zh) * | 2020-01-14 | 2020-06-09 | 北京明略软件***有限公司 | 一种知识图谱的生成方法和装置及计算机可读存储介质 |
CN111161711B (zh) * | 2020-04-01 | 2020-07-03 | 支付宝(杭州)信息技术有限公司 | 对流式语音识别文本进行断句的方法及装置 |
CN111161711A (zh) * | 2020-04-01 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 对流式语音识别文本进行断句的方法及装置 |
CN113628626A (zh) * | 2020-05-09 | 2021-11-09 | 阿里巴巴集团控股有限公司 | 语音识别方法、装置和***以及翻译方法和*** |
CN114420102B (zh) * | 2022-01-04 | 2022-10-14 | 广州小鹏汽车科技有限公司 | 语音断句方法、装置、电子设备及存储介质 |
CN114420102A (zh) * | 2022-01-04 | 2022-04-29 | 广州小鹏汽车科技有限公司 | 语音断句方法、装置、电子设备及存储介质 |
CN114648984B (zh) * | 2022-05-23 | 2022-08-19 | 深圳华策辉弘科技有限公司 | 音频断句方法、装置、计算机设备及存储介质 |
CN114648984A (zh) * | 2022-05-23 | 2022-06-21 | 深圳华策辉弘科技有限公司 | 音频断句方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108549628B (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108549628A (zh) | 流式自然语言信息的断句装置及方法 | |
CN110728997B (zh) | 一种基于情景感知的多模态抑郁症检测*** | |
CN108962255B (zh) | 语音会话的情绪识别方法、装置、服务器和存储介质 | |
CN106611597B (zh) | 基于人工智能的语音唤醒方法和装置 | |
CN110364171B (zh) | 一种语音识别方法、语音识别***及存储介质 | |
CN110838289A (zh) | 基于人工智能的唤醒词检测方法、装置、设备及介质 | |
US20170270922A1 (en) | Smart home control method based on emotion recognition and the system thereof | |
CN110263322A (zh) | 用于语音识别的音频语料筛选方法、装置及计算机设备 | |
CN111951789B (zh) | 语音识别模型的训练、语音识别方法、装置、设备及介质 | |
CN105895103A (zh) | 一种语音识别方法及装置 | |
CN110010136B (zh) | 韵律预测模型的训练和文本分析方法、装置、介质和设备 | |
CN103559880B (zh) | 语音输入***和方法 | |
CN110120221A (zh) | 用于车机***的用户个性化离线语音识别方法及其*** | |
CN110599999A (zh) | 数据交互方法、装置和机器人 | |
CN110930993A (zh) | 特定领域语言模型生成方法及语音数据标注*** | |
CN110148399A (zh) | 一种智能设备的控制方法、装置、设备及介质 | |
Buß et al. | Evaluation and optimisation of incremental processors | |
CN112579762B (zh) | 一种基于语义、情感惯性和情感共性的对话情感分析方法 | |
CN112489618A (zh) | 利用多级别上下文特征的神经文本到语音合成 | |
CN104347071B (zh) | 生成口语考试参***的方法及*** | |
CN108446278A (zh) | 一种基于自然语言的语义理解***及方法 | |
CN117349427A (zh) | 一种面向舆情事件应对的人工智能多模态内容生成*** | |
CN109933773A (zh) | 一种多重语义语句解析***及方法 | |
JP2002215187A (ja) | 音声認識方法及びその装置 | |
CN112802460B (zh) | 一种基于语音处理的空间环境预报*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096 Applicant after: Yunzhisheng Intelligent Technology Co.,Ltd. Address before: 12 / F, Guanjie building, building 1, No. 16, Taiyanggong Middle Road, Chaoyang District, Beijing Applicant before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |